Redian新闻
>
GPT4、百度文心一言、讯飞星火、360智脑:谁更懂数据分析?

GPT4、百度文心一言、讯飞星火、360智脑:谁更懂数据分析?

科技

前面考察了几个大语言模型写高考作文的能力,文章见链接:GPT作文能力比拼:GPT3.5、GPT4、百度文心一言、讯飞星火

今天让他们做一个关于房价预测的数据分析题,和一道简单的24点计算题目,看看他们的智能程度。

参赛选手分别是:GPT3.5、 GPT4,百度文心一言、讯飞星火、360智脑。

分析一下这批数据,井根据数据预测2023年的月度数据。

将以上图片的通过OCR识别出文本,输入到大语言模型,看看各自语言模型是否能识别出这是一组数据,数据有两列,分别是【年月】、【商品房销售额_当月值全国(亿元)】。

下面是提示词:

分析一下这批数据,井根据数据预测2023年的月度数据。商品房销售额_当月值全国(亿元)2005-08 2005-09 1285.93 2005-10 1612.59 2005-11 1504.25 2005-12 3650.16 2006-02 2006-03 1310.77 2006-041422.65 2006-05 1654.69 2006-06 1687.44 2006-07 1482.6 2006-08 1430.64 2006-09 1544.62 2006-10 1637.83 2006-11 2088.19 2006-12 4368.32 2007-02 2007-03 1802.85 2007-04 1946.57 2007-05 2062.43 2007-06 2583.08 2007-07 2499.61 2007-08 2677.9 2007-09 2864.43 2007-10 2602.18 2007-11 2715.69 2007-12 5601.23 2008-02 2008-03 1941.22 2008-04 1808.82 2008-05 1932.452008-06 2488.19 2008-07 1895.74 2008-08 1592.27 2008-09 2065.09 2008-10 1711.5 2008-11 1671.16 2008-12 4810.22 2009-02 2009-03 2661.66 2009-04 2937.28 2009-05 3393 2009-06 4410.652009-07 3800.02 2009-08 3864.15 2009-09 4068.15 2009-10 3997.23 2009-11 4458 2009-12 8007.42 2010-02 2010-03 3861.06 2010-04 4448.44 2010-05 3334.95 2010-06 4059.66 2010-07 3065.84 2010-08 3532.55 2010-09 5498.34 2010-10 5075.6965 2010-11 5285.6124 2010-12 10200.8349 2011-02 2011-03 4910.3001 2011-04 3925.8176 2011-05 4542.3699 2011-06 5969.3198 2011-07 4262.6903 2011-08 4412.2911 2011-09 6047.1417 2011-10 4514.6993 2011-11 5220.6231 2011-12 10072.2263 2012-02 2012-03 4527.4436 2012-04 3749.0627 2012-05 4511.0704 2012-06 6381.8784 2012-07 5385,4377 2012-08 5311.6321 2012-09 6342.561 2012-10 5947.0909 2012-11 7225.1754 2012-12 10929.8514 2013-02 2013-03 6630.2951 2013-04 5855.5575 2013-05 6016.792 2013-06 7512.42872013-07 6172.4362 2013-08 6175.1417 2013-09 8304.1469 2013-10 7209.5014 2013-11 8708.3629 2013-12 11482.2887 2014-02 2014-03 6172.5394 2014-04 5043.6037 2014-05 5367.0786 2014-06 7459.1705 2014-07 5182.3244 2014-08 5345.8709 2014-09 7565.9972 2014-10 7157.924 2014-11 8095.6543 2014-12 11811.826 2015-02 2015-03 6050.7876 2015-04 5715.6464 2015-05 6669.894 2015-06 9850.5908 2015-07 6911.5538 2015-08 6870.8021 2015-09 8703,4371 2015-10 8044.772 2015-11 9732.4163 2015-12 12758.6492 2016-02 2016-03 9947.4532 2016-04 9131.3877 2016-05 9119.84132016-06 11906.8565 2016-07 8886.6974 2016-08 9053.9298 2016-09 13585.1795 2016-10 11273.9635 2016-11 11020.5529 2016-12 15124.3263 2017-02 2017-03 12376.717 2017-04 10040.3612 2017-05 10409.1144 2017-06 15520.1006 2017-07 9309.5341 2017-08 9634.2285 2017-09 13807.9419 2017-10 11086.8093 2017-11 12490.2551 2017-12 18220.7085 2018-02 2018-03 13143.5348 2018-04 10625.2979 2018-05 12555.0888 2018-06 18167.659 2018-07 11354.9193 2018-08 11095.8636 2018-09 14736.2188 2018-10 11781.4403 2018-11 13594.4241 2018-12 20464.6418 2019-02 2019-03 14235.42612019-04 12102:1034 2019-05 12631.9567 2019-06 18925.2292 2019-07 12464.2893 2019-08 12210.6015 2019-09 16118.3356 2019-10 12925.9598 2019-11 14588.5334 2019-12 20719.3441 2020-02;020-03 12161.3928 2020-04 11498.2282 2020-05 14406.3898 2020-06 20625.0888 2020-07 14527.4609 2020-08 15520.5098 2020-09 18704.7502 2020-10 16017.7975 2020-11 17303.6463 2020-1224643.9253 2021-02 2021-03 19227.0543 2021-04 15231.3605 2021-05 16924.5452 2021-06 22397.6093 2021-07 13499.1176 2021-08 12616.4378 2021-09 15748,0665 2021-10 12389.7274 2021-11 14482.0459 2021-12 20263.2468 2022-02 2022-03 14195,.9223 2022-04 8134.8046 2022-05 10547,.2016 2022-06 17735.7778 2022-07 9690.6175 2022-08 10106.5186 2022-09 13510.:762 2022-10.9452.5258 2022-11 9815.3759 2022-12 14660.2434

GPT3.5 数据分析结果:        

题目二:计算24点

再来一道计算24点的题目,看看简单的计算能力:

一次做对:(8-2) x (5-1) = 6 x 4 = 24


GPT4  数据分析结果:        

根据这批2005年至2022年的商品房销售额数据,我们可以大致观察到以下趋势:

  1. 商品房销售额整体呈上升趋势,尤其是在2009年后,销售额明显增长较快。

  2. 商品房销售额具有季节性波动,通常在每年的第二季度和第四季度较高,第一季度和第三季度较低。

  3. 商品房销售额在每年的2月份数据缺失,可能是由于春节假期的影响。

为预测2023年的月度数据,我们可以通过时间序列分析对这批数据进行建模。这里我们使用简单的线性回归模型进行预测。首先,我们需要将时间序列数据中的月份转换为数字,从2005年8月开始计算。

接下来,我们使用线性回归模型进行拟合:

import numpy as np
import pandas as pd
from sklearn.linear_model import LinearRegression

# 将时间序列数据转换为 DataFrame
data = [...] # 将数据粘贴到这里
df = pd.DataFrame(data, columns=['date', 'sales'])

# 将日期转换为数字(从2005年8月开始计算)
df['month_number'] = (df['date'].dt.year - 2005) * 12 + df['date'].dt.month - 8

# 拟合线性回归模型
X = df[['month_number']]
y = df['sales']
model = LinearRegression().fit(X, y)

# 预测2023年的月度数据
pred_month_numbers = np.array(range(217, 229)).reshape(-1, 1)
pred_sales = model.predict(pred_month_numbers)

# 输出预测结果
for month_number, sale in zip(pred_month_numbers, pred_sales):
print(f"{month_number}: {sale:.2f}")

运行上述代码后,我们得到2023年的月度商品房销售额预测如下(单位:亿元):

  • 2023-01: 22170.12

  • 2023-02: 22343.90

  • 2023-03: 22517.69

  • 2023-04: 22691.47

  • 2023-05: 22865.26

  • 2023-06: 23039.04

  • 2023-07: 23212.83

  • 2023-08: 23386.61

  • 2023-09: 23560.40

  • 2023-10: 23734.18

  • 2023-11: 23907.97

  • 2023-12: 24081.75


请注意,这仅是一个简单的线性回归预测,实际情况可能会受到许多因素的影响,如政策调整、市场需求变化等。为了获得更准确的预测结果,可以尝试使用更复杂的时间序列模型,如ARIMA、LSTM等。

题目二:计算24点

第一次答题错误,经过2轮的提醒,最终给出了正确答案。


讯飞星火   数据分析结果:      

网址:xinghuo.xfyun.cn

你提供的数据看起来像是某个时间段内的商品房销售额数据,但是没有给出具体的时间范围和单位。如果你能提供更多的信息,我会很乐意帮助你分析这些数据。

不过,从你给出的数据来看,我们可以计算出每个月的平均销售额:

        

python复制代码


import pandas as pd



data = {'2005-02': 1285.69, '2005-03': 1347.59, '2005-04': 1466.87, ...} # 这里省略了部分数据

df = pd.DataFrame(data)



monthly_average = df.mean(axis=1)

print(monthly_average)


输出结果为:

        

复制代码


2005-02 1285.69

2005-03 1347.59

2005-04 1466.87

... ...

2022-11 9815.3759

2022-12 14660.2434

dtype: float64


这个结果表示在2005年到2022年之间,每个月的商品房销售额的平均值。


题目二:计算24点


计算不对,再给一次机会:

最终,讯飞星火的计算24点的题目,无法完成任务。


百度文心一言   数据分析结果:      


题目二:计算24点


360智脑  数据分析结果:      

题目一:

题目二:计算24点

给了两次机会,都没有做对。

(1*5+8)*2=30

(1*8+5)*2=36

(5-1)82-24


综合比较

对比这五个大语言模型的表现,首先是房价预测题目:

     语言模型

现有数据分析

预测方法提示

预测数据计算
GPT3.5   有 有
GPT4   有

百度文心一言   有 有
讯飞星火   无 无
360智脑
   有



第二个是计算24点的题目:

     语言模型

题目理解

计算过程

结果显示
GPT3.5能理解 正确正确
GPT4能理解

经提示后

正确

正确
百度文心一言能理解

 正

十种解法

十种解法

都正确

讯飞星火能理解 错误错误
360智脑
 能理解
错误
错误


综合来看,GPT4给出了房价走势的预测方法和结论,采用简单的线性回归模型进行预测,预测结果自然就比较简单,呈现一个逐月上升的线性递增。没想到的是,在计算24点这个题目上,GPT4居然翻车了,第一次回答错误;后来给出两轮提醒,终于GPT4给出了正确的算式和结果。

GPT3.5,在房价预测和24点计算方面,均表现不错。房价预测,可以考虑多种变量对房价的影响,譬如季节变化等因素,预测的结果也相对比GPT4的简单线性预测更贴近实际。24点的技术,则很快给出了一种解法和正确答案。

百度文心一言在算24点这个题目上稳操胜券,超出预期,有些惊喜,给出10种解法。预测房价走势的题目上,文心一言给出的分析思路算是不错,可惜没有继续给出计算的结果。

讯飞星火,在房价预测和计算24点的题目方面,表现不佳,题目给出的数据是有月份和数值、单位的,但是星火没有识别出来。24点的计算,同样给了多次机会,没有计算出来。

360智脑,对于房价预测,比较精炼,给出思路,没有过程和结果计算。24点的计算题目,同样无法给出正确的算式和结果。

  • 房价预测能力从高到低排序依次是:

GPT3.5、GPT4、百度文心一言、360智脑、讯飞星火。

  • 计算24点能力从高到低排序依次是:

百度文心一言、GPT3.5、GPT4;讯飞星火和360智脑都有待提升。

==========

欢迎留言,对以上四个大语言模型的数据分析能力给出自己的评价。

如果你对ChatGPT在工作和生活中的应用感兴趣,欢迎加我微信,邀请进群一起探讨学习如何用好ChatGPT。

加好友注明自己的真实身份:昵称(姓名)- 城市 - 职业(专业)

=======================

公众号:BLUES,已经持续更新了10年的公众号。20年丰富的职场经历,历经连续创业、腾讯、YY语音、迅雷等公司。目前致力于“教育+科技”产品创造,深圳梅沙科技合伙人。700多篇文章写互联网产品经理职业发展,企业管理,洞察职场与人生,欢迎大家留言交流。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
百度搜索小范围公测“对话”功能,基于文心一言大语言模型文心一言一把火,百度智能云盈利了!李彦宏诚不欺我?百度高管解读财报:文心一言很快会大规模向更多用户部署一个案例,看懂数据分析全流程大型语言模型技术公开课上线4讲!直播讲解ChatGPT开源平替、类GPT4低成本定制以及GPT4Tools问360智脑五个刁钻问题,下面是它的回复大模型之争,讯飞星火准备好了讯飞星火V2.0突破代码能力,一个指令生成贪吃蛇游戏,10分钟开发“凌空手写”科大讯飞公布讯飞星火认知大模型;羊了个羊涉“欺骗误导强迫用户”被通报 ;苹果手机或被欧盟禁售……福州,为什么选择百度文心一言?录音直接成稿!一秒批改作文!科大讯飞星火认知大模型三大能力超过ChatGPT实测讯飞星火App:没有感情、只有公式GPT作文能力比拼:GPT3.5、GPT4、百度文心一言、讯飞星火手机也能用文心一言了!百度文心一言 App 正式上架 iOS 平台讯飞星火大模型抢先进入​「升级战」:中国版ChatGPT来了人人擁有一個單純的心,每天過著簡單的生活,就是大同世界科大讯飞股价暴跌,甩锅文心一言;富豪拿儿子当“血童” | 金错刀日评百度文心一言App上架苹果AppStore,4月份曾否认2023“雷军年度演讲”在今晚7点举行;讯飞星火位列国产主流大模型测评榜首位|绿研院日报Q1财报发布,阿里云、腾讯云、百度云谁更欢喜谁更愁?|甲子光年据称百度文心大模型内测多项得分超ChatGPT;OpenAI等将向英国政府开放模型 | 环球科学要闻百度王海峰:文心一言响应速度一个月提高十倍,后台成本大幅降低,缘于飞桨文心联合优化试完更新后的360智脑,我觉得周鸿祎可能没在吹牛。文心一言比你更懂互联网大厂显化与宇宙吸引力法则早财经丨东北局地或有大暴雨,甚至龙卷风;波兰国防部:两架白俄罗斯直升机侵犯领空;讯飞星火APP在苹果应用商店下架实测「360智脑」的真正实力:能否领跑国内百“模”大战?「360智脑大模型4.0」正式发布,支持文生视频,已接入360全家桶|最前线父亲参军记(2)余秀华诗歌讯飞星火大模型V1.5发布 刘庆峰:我们要追赶OpenAI关东关西,职场规矩业绩超预期!百度“文心一言”最新计划曝光GPT4百度文心一格总架构师肖欣延:历程坎坷但未来已至,大模型赋能智能内容生成|WISE2023颠覆AIGC产业发展峰会早报|员工每天带薪拉屎3至6小时被解雇;姚明不再兼任CBA公司董事长;文心一言市场负责人怒怼科大讯飞;多地出现“负首付”买房
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。