Redian新闻
>
GPT4、百度文心一言、讯飞星火、360智脑:谁更懂数据分析?

GPT4、百度文心一言、讯飞星火、360智脑:谁更懂数据分析?

科技

前面考察了几个大语言模型写高考作文的能力,文章见链接:GPT作文能力比拼:GPT3.5、GPT4、百度文心一言、讯飞星火

今天让他们做一个关于房价预测的数据分析题,和一道简单的24点计算题目,看看他们的智能程度。

参赛选手分别是:GPT3.5、 GPT4,百度文心一言、讯飞星火、360智脑。

分析一下这批数据,井根据数据预测2023年的月度数据。

将以上图片的通过OCR识别出文本,输入到大语言模型,看看各自语言模型是否能识别出这是一组数据,数据有两列,分别是【年月】、【商品房销售额_当月值全国(亿元)】。

下面是提示词:

分析一下这批数据,井根据数据预测2023年的月度数据。商品房销售额_当月值全国(亿元)2005-08 2005-09 1285.93 2005-10 1612.59 2005-11 1504.25 2005-12 3650.16 2006-02 2006-03 1310.77 2006-041422.65 2006-05 1654.69 2006-06 1687.44 2006-07 1482.6 2006-08 1430.64 2006-09 1544.62 2006-10 1637.83 2006-11 2088.19 2006-12 4368.32 2007-02 2007-03 1802.85 2007-04 1946.57 2007-05 2062.43 2007-06 2583.08 2007-07 2499.61 2007-08 2677.9 2007-09 2864.43 2007-10 2602.18 2007-11 2715.69 2007-12 5601.23 2008-02 2008-03 1941.22 2008-04 1808.82 2008-05 1932.452008-06 2488.19 2008-07 1895.74 2008-08 1592.27 2008-09 2065.09 2008-10 1711.5 2008-11 1671.16 2008-12 4810.22 2009-02 2009-03 2661.66 2009-04 2937.28 2009-05 3393 2009-06 4410.652009-07 3800.02 2009-08 3864.15 2009-09 4068.15 2009-10 3997.23 2009-11 4458 2009-12 8007.42 2010-02 2010-03 3861.06 2010-04 4448.44 2010-05 3334.95 2010-06 4059.66 2010-07 3065.84 2010-08 3532.55 2010-09 5498.34 2010-10 5075.6965 2010-11 5285.6124 2010-12 10200.8349 2011-02 2011-03 4910.3001 2011-04 3925.8176 2011-05 4542.3699 2011-06 5969.3198 2011-07 4262.6903 2011-08 4412.2911 2011-09 6047.1417 2011-10 4514.6993 2011-11 5220.6231 2011-12 10072.2263 2012-02 2012-03 4527.4436 2012-04 3749.0627 2012-05 4511.0704 2012-06 6381.8784 2012-07 5385,4377 2012-08 5311.6321 2012-09 6342.561 2012-10 5947.0909 2012-11 7225.1754 2012-12 10929.8514 2013-02 2013-03 6630.2951 2013-04 5855.5575 2013-05 6016.792 2013-06 7512.42872013-07 6172.4362 2013-08 6175.1417 2013-09 8304.1469 2013-10 7209.5014 2013-11 8708.3629 2013-12 11482.2887 2014-02 2014-03 6172.5394 2014-04 5043.6037 2014-05 5367.0786 2014-06 7459.1705 2014-07 5182.3244 2014-08 5345.8709 2014-09 7565.9972 2014-10 7157.924 2014-11 8095.6543 2014-12 11811.826 2015-02 2015-03 6050.7876 2015-04 5715.6464 2015-05 6669.894 2015-06 9850.5908 2015-07 6911.5538 2015-08 6870.8021 2015-09 8703,4371 2015-10 8044.772 2015-11 9732.4163 2015-12 12758.6492 2016-02 2016-03 9947.4532 2016-04 9131.3877 2016-05 9119.84132016-06 11906.8565 2016-07 8886.6974 2016-08 9053.9298 2016-09 13585.1795 2016-10 11273.9635 2016-11 11020.5529 2016-12 15124.3263 2017-02 2017-03 12376.717 2017-04 10040.3612 2017-05 10409.1144 2017-06 15520.1006 2017-07 9309.5341 2017-08 9634.2285 2017-09 13807.9419 2017-10 11086.8093 2017-11 12490.2551 2017-12 18220.7085 2018-02 2018-03 13143.5348 2018-04 10625.2979 2018-05 12555.0888 2018-06 18167.659 2018-07 11354.9193 2018-08 11095.8636 2018-09 14736.2188 2018-10 11781.4403 2018-11 13594.4241 2018-12 20464.6418 2019-02 2019-03 14235.42612019-04 12102:1034 2019-05 12631.9567 2019-06 18925.2292 2019-07 12464.2893 2019-08 12210.6015 2019-09 16118.3356 2019-10 12925.9598 2019-11 14588.5334 2019-12 20719.3441 2020-02;020-03 12161.3928 2020-04 11498.2282 2020-05 14406.3898 2020-06 20625.0888 2020-07 14527.4609 2020-08 15520.5098 2020-09 18704.7502 2020-10 16017.7975 2020-11 17303.6463 2020-1224643.9253 2021-02 2021-03 19227.0543 2021-04 15231.3605 2021-05 16924.5452 2021-06 22397.6093 2021-07 13499.1176 2021-08 12616.4378 2021-09 15748,0665 2021-10 12389.7274 2021-11 14482.0459 2021-12 20263.2468 2022-02 2022-03 14195,.9223 2022-04 8134.8046 2022-05 10547,.2016 2022-06 17735.7778 2022-07 9690.6175 2022-08 10106.5186 2022-09 13510.:762 2022-10.9452.5258 2022-11 9815.3759 2022-12 14660.2434

GPT3.5 数据分析结果:        

题目二:计算24点

再来一道计算24点的题目,看看简单的计算能力:

一次做对:(8-2) x (5-1) = 6 x 4 = 24


GPT4  数据分析结果:        

根据这批2005年至2022年的商品房销售额数据,我们可以大致观察到以下趋势:

  1. 商品房销售额整体呈上升趋势,尤其是在2009年后,销售额明显增长较快。

  2. 商品房销售额具有季节性波动,通常在每年的第二季度和第四季度较高,第一季度和第三季度较低。

  3. 商品房销售额在每年的2月份数据缺失,可能是由于春节假期的影响。

为预测2023年的月度数据,我们可以通过时间序列分析对这批数据进行建模。这里我们使用简单的线性回归模型进行预测。首先,我们需要将时间序列数据中的月份转换为数字,从2005年8月开始计算。

接下来,我们使用线性回归模型进行拟合:

import numpy as np
import pandas as pd
from sklearn.linear_model import LinearRegression

# 将时间序列数据转换为 DataFrame
data = [...] # 将数据粘贴到这里
df = pd.DataFrame(data, columns=['date', 'sales'])

# 将日期转换为数字(从2005年8月开始计算)
df['month_number'] = (df['date'].dt.year - 2005) * 12 + df['date'].dt.month - 8

# 拟合线性回归模型
X = df[['month_number']]
y = df['sales']
model = LinearRegression().fit(X, y)

# 预测2023年的月度数据
pred_month_numbers = np.array(range(217, 229)).reshape(-1, 1)
pred_sales = model.predict(pred_month_numbers)

# 输出预测结果
for month_number, sale in zip(pred_month_numbers, pred_sales):
print(f"{month_number}: {sale:.2f}")

运行上述代码后,我们得到2023年的月度商品房销售额预测如下(单位:亿元):

  • 2023-01: 22170.12

  • 2023-02: 22343.90

  • 2023-03: 22517.69

  • 2023-04: 22691.47

  • 2023-05: 22865.26

  • 2023-06: 23039.04

  • 2023-07: 23212.83

  • 2023-08: 23386.61

  • 2023-09: 23560.40

  • 2023-10: 23734.18

  • 2023-11: 23907.97

  • 2023-12: 24081.75


请注意,这仅是一个简单的线性回归预测,实际情况可能会受到许多因素的影响,如政策调整、市场需求变化等。为了获得更准确的预测结果,可以尝试使用更复杂的时间序列模型,如ARIMA、LSTM等。

题目二:计算24点

第一次答题错误,经过2轮的提醒,最终给出了正确答案。


讯飞星火   数据分析结果:      

网址:xinghuo.xfyun.cn

你提供的数据看起来像是某个时间段内的商品房销售额数据,但是没有给出具体的时间范围和单位。如果你能提供更多的信息,我会很乐意帮助你分析这些数据。

不过,从你给出的数据来看,我们可以计算出每个月的平均销售额:

        

python复制代码


import pandas as pd



data = {'2005-02': 1285.69, '2005-03': 1347.59, '2005-04': 1466.87, ...} # 这里省略了部分数据

df = pd.DataFrame(data)



monthly_average = df.mean(axis=1)

print(monthly_average)


输出结果为:

        

复制代码


2005-02 1285.69

2005-03 1347.59

2005-04 1466.87

... ...

2022-11 9815.3759

2022-12 14660.2434

dtype: float64


这个结果表示在2005年到2022年之间,每个月的商品房销售额的平均值。


题目二:计算24点


计算不对,再给一次机会:

最终,讯飞星火的计算24点的题目,无法完成任务。


百度文心一言   数据分析结果:      


题目二:计算24点


360智脑  数据分析结果:      

题目一:

题目二:计算24点

给了两次机会,都没有做对。

(1*5+8)*2=30

(1*8+5)*2=36

(5-1)82-24


综合比较

对比这五个大语言模型的表现,首先是房价预测题目:

     语言模型

现有数据分析

预测方法提示

预测数据计算
GPT3.5   有 有
GPT4   有

百度文心一言   有 有
讯飞星火   无 无
360智脑
   有



第二个是计算24点的题目:

     语言模型

题目理解

计算过程

结果显示
GPT3.5能理解 正确正确
GPT4能理解

经提示后

正确

正确
百度文心一言能理解

 正

十种解法

十种解法

都正确

讯飞星火能理解 错误错误
360智脑
 能理解
错误
错误


综合来看,GPT4给出了房价走势的预测方法和结论,采用简单的线性回归模型进行预测,预测结果自然就比较简单,呈现一个逐月上升的线性递增。没想到的是,在计算24点这个题目上,GPT4居然翻车了,第一次回答错误;后来给出两轮提醒,终于GPT4给出了正确的算式和结果。

GPT3.5,在房价预测和24点计算方面,均表现不错。房价预测,可以考虑多种变量对房价的影响,譬如季节变化等因素,预测的结果也相对比GPT4的简单线性预测更贴近实际。24点的技术,则很快给出了一种解法和正确答案。

百度文心一言在算24点这个题目上稳操胜券,超出预期,有些惊喜,给出10种解法。预测房价走势的题目上,文心一言给出的分析思路算是不错,可惜没有继续给出计算的结果。

讯飞星火,在房价预测和计算24点的题目方面,表现不佳,题目给出的数据是有月份和数值、单位的,但是星火没有识别出来。24点的计算,同样给了多次机会,没有计算出来。

360智脑,对于房价预测,比较精炼,给出思路,没有过程和结果计算。24点的计算题目,同样无法给出正确的算式和结果。

  • 房价预测能力从高到低排序依次是:

GPT3.5、GPT4、百度文心一言、360智脑、讯飞星火。

  • 计算24点能力从高到低排序依次是:

百度文心一言、GPT3.5、GPT4;讯飞星火和360智脑都有待提升。

==========

欢迎留言,对以上四个大语言模型的数据分析能力给出自己的评价。

如果你对ChatGPT在工作和生活中的应用感兴趣,欢迎加我微信,邀请进群一起探讨学习如何用好ChatGPT。

加好友注明自己的真实身份:昵称(姓名)- 城市 - 职业(专业)

=======================

公众号:BLUES,已经持续更新了10年的公众号。20年丰富的职场经历,历经连续创业、腾讯、YY语音、迅雷等公司。目前致力于“教育+科技”产品创造,深圳梅沙科技合伙人。700多篇文章写互联网产品经理职业发展,企业管理,洞察职场与人生,欢迎大家留言交流。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
一个案例,看懂数据分析全流程百度搜索小范围公测“对话”功能,基于文心一言大语言模型试完更新后的360智脑,我觉得周鸿祎可能没在吹牛。实测讯飞星火App:没有感情、只有公式Q1财报发布,阿里云、腾讯云、百度云谁更欢喜谁更愁?|甲子光年科大讯飞股价暴跌,甩锅文心一言;富豪拿儿子当“血童” | 金错刀日评录音直接成稿!一秒批改作文!科大讯飞星火认知大模型三大能力超过ChatGPT讯飞星火V2.0突破代码能力,一个指令生成贪吃蛇游戏,10分钟开发“凌空手写”手机也能用文心一言了!百度文心一言 App 正式上架 iOS 平台百度文心一格总架构师肖欣延:历程坎坷但未来已至,大模型赋能智能内容生成|WISE2023颠覆AIGC产业发展峰会早财经丨东北局地或有大暴雨,甚至龙卷风;波兰国防部:两架白俄罗斯直升机侵犯领空;讯飞星火APP在苹果应用商店下架文心一言比你更懂互联网大厂GPT作文能力比拼:GPT3.5、GPT4、百度文心一言、讯飞星火业绩超预期!百度“文心一言”最新计划曝光关东关西,职场规矩问360智脑五个刁钻问题,下面是它的回复余秀华诗歌百度文心一言App上架苹果AppStore,4月份曾否认福州,为什么选择百度文心一言?「360智脑大模型4.0」正式发布,支持文生视频,已接入360全家桶|最前线2023“雷军年度演讲”在今晚7点举行;讯飞星火位列国产主流大模型测评榜首位|绿研院日报早报|员工每天带薪拉屎3至6小时被解雇;姚明不再兼任CBA公司董事长;文心一言市场负责人怒怼科大讯飞;多地出现“负首付”买房文心一言一把火,百度智能云盈利了!李彦宏诚不欺我?科大讯飞公布讯飞星火认知大模型;羊了个羊涉“欺骗误导强迫用户”被通报 ;苹果手机或被欧盟禁售……大模型之争,讯飞星火准备好了百度高管解读财报:文心一言很快会大规模向更多用户部署实测「360智脑」的真正实力:能否领跑国内百“模”大战?显化与宇宙吸引力法则GPT4百度王海峰:文心一言响应速度一个月提高十倍,后台成本大幅降低,缘于飞桨文心联合优化父亲参军记(2)人人擁有一個單純的心,每天過著簡單的生活,就是大同世界讯飞星火大模型V1.5发布 刘庆峰:我们要追赶OpenAI讯飞星火大模型抢先进入​「升级战」:中国版ChatGPT来了据称百度文心大模型内测多项得分超ChatGPT;OpenAI等将向英国政府开放模型 | 环球科学要闻大型语言模型技术公开课上线4讲!直播讲解ChatGPT开源平替、类GPT4低成本定制以及GPT4Tools
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。