Redian新闻
>
字节版ChatGPT悄悄开放,免费无排队,抖音号手机号直接登

字节版ChatGPT悄悄开放,免费无排队,抖音号手机号直接登

科技
克雷西 鱼羊 发自 凹非寺
量子位 | 公众号 QbitAI

字节跳动版ChatGPT,现在人人可玩了!

网页版、安卓版和iOS版同步上线,用抖音账号、手机号和苹果账号都能登录。

并且无需排队,打开就能和这个名叫“豆包”的AI助手直接开聊。

是doubao.com不是douban.com噢~

消息一出,已经有不少胖友第一时间前往围(tiao)观(xi)。

我们也抓紧实测了一波~

与ChatGLM难分伯仲

先来看看豆包是怎么介绍自己的:

既然如此,我们就来试试这些“官方功能”靠不靠谱。

比如,我们挑选了几个有意思的错误机翻让豆包纠正,结果豆包给出的反馈还挺不错的:

尤其是“鸳鸯锅”的翻译,可以说是完胜Google和DeepL。

知识方面的话,当然要问一下“刁钻”的问题了:雷公电母放出的电是直流电还是交流电。

豆包的这个回答,可以概括成“不是直流电,而是直流电”😂,但前面说的还算可以吧。

抛开整活的话,豆包的开胃小菜的确给了我们一个不错的第一印象。

那么下面我们就上正餐——来拿它和备受好评的国产开源大模型ChatGLM进行一场大横评。

具体的内容包括文案创作、逻辑推理、数学和代码四个方面。

文案创作方面,豆包说自己会撰写知乎、小红书等各种风格的文案。

我们不妨整个奇葩点的东西,看看它能不能创作得出来,比如……豆汁美式的小红书笔记。

文案搭配着emoji,连Tag都有了,看来豆包真的是懂小红书的。

不过你确定“醇香甘甜”这个词是用来形容豆汁的吗……

ChatGLM虽然写了很多,但是没审清题,把豆汁直接当成了豆浆……

(这么一看,豆包可能也理解成豆浆了,但是人家没直接说成豆浆啊

看来豆包是有一定创作能力的,所以不妨再加大难度

直接让它给“豆汁美式”的宣传片写个短视频脚本。

ChatGLM的版本细节则要丰富些,不过豆包的版本也算是五脏俱全了。

两者的文案创作水平不相上下,那么逻辑推理能力又怎么样呢?

我们找来了一道推理题目,这道题两位选手都没能做对(正确答案是甲3乙1丙2):

虽然都没做对,但是豆包的思路好像在往正确的方向上走了。

而ChatGLM的解答,反正我是没看懂。

这一环节对两者的表现也是很难评价,那么,马上进入一众大模型的噩梦环节——数学。

简单如鸡兔同笼这样的问题就不测了,我们直接上难度,拿一道高考题给他们试试。

2023北京卷第16题

(图片我们没有输入,但没有图片也能解题;第一问是证明,我们也去掉了)

豆包使用的是纯几何方法,最后的答案是正确的,但很遗憾过程不对。

从红框开始出现错误

ChatGLM则使用了向量解法:

首先结果是错的,不过120倒是和60度互补,是出了些小问题吗?

但我们很快发现了华点:

这里不应该约等于就先不提了……两个正数相除你是怎么给约成个负数的……

标准答案是酱婶儿的,由于第二问要用到第一问的证明结论,所以把第一问的过程也放上来了:

如此看来,在数学修炼上,两位大模型选手都还有很大的进步空间。

那么面对大家喜闻乐见的代码问题,豆包又该如何应对呢?

先看比较基础的冒泡排序算法。

我们试着跑了一下(换掉了预设的数字),结果成功输出了答案:

接下来上LeetCode,我们先选了一个比较简单的把阿拉伯数字转换成罗马数字的题目。

豆包很快就生成了一段代码,还附带了解释:


而ChatGLM给出的代码是这样的(也附有解释):

运行的结果是豆包正确,ChatGLM错误:

不过稍微复杂一些的题目,他们就都做不对了。

除了设计算法,我们还想看看他们能不能用代码“画图”。

我们随机生成了两列数据,看看能不能搞个折线图出来:

结果用豆包的代码画出了这么个东西……

ChatGLM这边的情况嘛……好家伙,直接报错运行不了。

代码环节就先展示到这里了,用一句话说就是:都还得练。

看了这么多,想必读者朋友们已经有些累了,所以我们还准备了“餐后甜点”,来点轻松的内容。

弱智吧,开整!

Q1:萝卜到底能不能“开胃”呢?

“必要时寻求专业医生帮助”,这难道是在自己给自己做手术吗……

Q2:导盲犬禁止入内,是给盲人看得,还是给导盲犬看的?

豆包在A和B两个选项当中选择了C。

而问及“陨石为什么总砸中陨石坑”,豆包倒是说对了,只不过回答得有点复杂。

弱智吧的测评结果总结下来就是:AI还是太单纯,还没办法理解人类复杂的小心思。

字节跳动大模型开始发力

字节跳动选在这时候开放“豆包”测试,似乎有些令人意外。

但实际上,这个时间线倒推起来也不是无迹可寻:

在ChatGPT掀起狂澜的今年二三月,字节跳动就已有组建大模型团队的消息传出。

据36kr消息,其探索方向主要是语言和图像两类大模型,希望能将大模型与字节本身的搜索、广告等下游业务相结合。

但在当时,字节方面相关技术负责人的回应是:

技术中台在这些领域有探索,还很初期,不成熟。

此后的“百模大战”之中,字节跳动似乎并没有正式参战的意思,旗下云平台火山引擎,打出的也是“为大模型打造技术底座”、接入第三方大模型做大模型旗舰店商城的旗号。

直到6月份,字节跳动被曝开始内部测试一款AI对话类产品,代号“Grace”。

而Grace的网址“gracebot.cn”,现在会直接跳转到豆包官网。

虽然豆包本包并不承认自己就是Grace,但目前看来,豆包就是Grace的开放测试版本。

另外,“豆包”项目组的盆友向我们透露,豆包尚处于早期开发验证阶段。测试期还存在较多局限,生成的内容也可能不准确,欢迎测试用户们多提意见多反馈。

值得关注的是,最近,一个名叫BuboGPT的多模态大模型,在huggingface上上线了Demo。这一大模型背后同样有来自字节跳动的技术参与。

论文介绍,BuboGPT支持文本、图像、音频三种模态,能做到细粒度的多模态联合理解。

比如给它这样一张图片:

BuboGPT不仅能识别出青蛙和青蛙手里的班卓琴,还能总结出青蛙的具体动作、所处环境。

One More Thing

字节跳动终于出手,那么豆包这表现你给打几分?

话说回来,就在大模型渐渐走出每周都有新模发布的狂热期,国产大模型的先行者们,回答质量已经悄然进步了不少。

比如当初难倒众多大模型英雄汉的“爸妈婚礼不带我”问题,如今许多国产大模型都能回答得有理有据。

上百度下讯飞

国产大模型的评判标尺,或许也已到了再上一个台阶的时候。

所以,国产大模型百花齐放,是否也给到你新的惊喜了呢?欢迎在评论区与我们分享~

「中国仿生机器人产业全景报告 · 量子位智库」下载

AGI 的火热发展为仿生机器人的实现补全了最后一块拼图,仿⽣机器⼈将在技术创新和商业模式上迎来新周期。量子位智库发布《中国仿生机器人产业全景报告》,扫描下方二维码即可查看并下载完整报告。

9月6日,我们将在北京举办仿生机器人行业沙龙,欢迎感兴趣的企业联系活动负责人王琳玉,联系方式见下方。


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
ChatGPT 再次成为焦点:学生放弃导师,改用 ChatGPT 自学!科技与狠活席卷高校?文末送书 | 4个维度讲透ChatGPT技术原理,揭开ChatGPT神秘技术黑盒!全面开放,无需排队,Runway视频生成工具Gen-2开启免费试用澳洲强势回归!直接登顶全球榜首!大批明星被吸引而来!周杰伦谢霆锋都在,赶快偶遇吧拒绝花架子!盘点ChatGPT最强的七个插件:写提示词、学外语、总结视频,让ChatGPT做你的私人秘书腾讯版ChatGPT来了!免费又好用!Coach Outlet低至3折+额外8.5折!收大号手袋!惊了!某院医生用ChatGPT4个月写了16篇论文!成功发表5篇!(附ChatGPT干货教程)ChatGPT最强竞品Claude2来了:代码、GRE成绩超越GPT-4,免费可用阿里达摩院免费开放100件AI专利;字节推出大模型MBTI测试结果;ChatGPT自定义功能扩展免费丨AIGC大事日报澳大利亚直接登顶全球第一,成为全世界最适合外籍人士居住的国家!墨尔本,究竟有多适合移民?妈妈的发型引领手机向“全知全能”进化!iOS版ChatGPT推出联网模式:集成Bing搜索功能,仅对付费用户开放久遠的端午節回憶苹果,悄悄开发大模型无限访问GPT-4!史上最强企业版ChatGPT上线,3.2万token,OpenAI颠覆打工人OpenAI发布给ChatGPT定制人格角色的新功能;苹果已悄悄开发Apple GPT|AIGC周观察第十一期终于!墨尔本首家蜜雪冰城,今天第一天!大批华人排队,免费柠檬水爆抢一空从纽约64岁的大妈卖淫说起百年罕见!飓风直接登陆南加州,周日起预计有暴雨2023年11月美国移民排期公布:EB-5表B继续开放,签证预留类仍无排期!ChatGPT 又断网了!OpenAI 暂时下线 ChatGPT 搜索功能,只因绕过付费墙?智能周报|马斯克公布xAI战略细节;苹果已悄悄开发AppleGPT;Office 365中生成式AI功能定价30美元/月...ChatGPT 最强竞品 Claude2 来了:代码、GRE 成绩超越 GPT-4,免费可用独家采访WizardLM团队,详解WizardCoder/Math超越GPT4/ChatGPT的RLEIF算法惊呆!某院医生4个月用ChatGPT写了16篇论文,发表5篇!(附ChatGPT干货)历经3年、17位医生都没有确诊的病例,靠ChatGPT找到正确的诊断。找ChatGPT看病到底是否靠谱?3.2万token、无限访问GPT-4,史上最强企业版ChatGPT上线苹果悄悄开发Apple GPT一文总结13个国内外ChatGPT平替产品:是时候可以不那么依赖ChatGPT了~李雪琴的老同学们,捧红了一个单月涨粉200万的抖音号为了老baby们手机里的秘密,我研究了100个中老年抖音号5096 血壮山河之武汉会战 浴血田家镇 4移民生活(15)王老师的贤妻刘岩凤吉林电信辟谣八千万手机号背后:诈骗集团哪来的手机号?谁是内鬼?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。