Redian新闻
>
《西游记》把大模型给难倒了

《西游记》把大模型给难倒了

科技
衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

问:《西游记》里,总共提到过孙悟空这只猴少次

咱问了问ChatGPT,ChatGPT连连摇头,说《西游记》篇幅太长,它统计不出来。

不死心,又把这个问题问向了Claude。

Claude频频摆手,说因为不具备完整阅读和分析长篇文学作品的能力,无法统计。

事实上,不仅仅是ChatGPT和Claude答不上来,市面上的大模型几乎都无法(准确)回答这个问题

除了《西游记》作为章回体小说,本身篇幅太长外,“孙悟空”还在书里有各种各样的代词指代,比如大圣、孙行者、美猴王、心猿、甚至是你/我/他……

于是,大模型们在这道题面前只能束手就擒。

然而,对于任何一名人类传统程序员来说,这压根不算一个难题,只要用编程、逻辑推理去解决,确定的答案很容易摆在眼前。

但如果非要把解决方式切回“大模型”模式,幻觉和精度,就是最直接的问题。

一家国内的AI创业公司给出了它们的答案:选择做个人AI计算机,用它补齐大模型和AI应用间缺失的那一环。

尝试统一神经网路和高级编程语言

这家公司名为KMind,创始人吴翰清,他更为业内人士所熟知的身份是阿里云的道哥/小黑,是前阿里云首席安全科学家、P10级研究员。

去年5月离职阿里后,他和阿里前同事陈冬白携手创业,又邀请来西湖大学AutoLab(自主智能实验室)负责人于开丞担任首席科学家,KMind的核心团队就这么搭建起来了。

在去年7月,KMind曾推出过一款面向C端用户的AIGC效率工具。

7月份推出,不到3个月时间,这款AIGC效率工具已经拥有了10万用户。

但困境伴随而生:用户流失率非常高。

吴翰清最终思考出的结论是,没有人喜欢一个满嘴谎话、不懂装懂的人,尤其是那些从未接触过AI、不知AI为何物的用户,第一次用上AIGC效率工具,往往会把对方当成一个在和自己交流的真实的人。

这样就会导致用户一旦发现AI不靠谱,就会气到当场弃用

“目前LLM在解决幻觉问题上主要还是靠对齐,但这类技术治标不治本。要想彻底解决这个问题,我认为还得从LLM之外寻求答案。”

当然,“幻觉”仅仅是大模型存在的最大问题之一,另一个问题,也是大模型无法准确回答西游记里有多少孙悟空的另一个原因,是书中指代孙悟空的名词、代词太多,大模型目前的推理能力还无法进行精准判断

“对于所有的程序员来说,逻辑推理都不是一个问题,1+1必然等于2。”正如吴翰清所说,“但是对于所有做神经网络的人来说,如何让神经网络自动生成1+1=2这个答案并不容易。”

基于这一点,KMind团队的思考逐渐清晰:

不如试试,统一神经网络和高级编程语言

神经网络主要提供泛化能力,高级编程语言则提供逻辑推理能力和精准控制能力,两者连接起来,双管齐下,就能解决大部分问题。

提出“个人AI计算机”

沿着这个思路提出一种具体的解决办法,就是KMind所提出的造一个拥有新型计算机操作系统kOS的“个人AI计算机”。

先简单了解一下,什么是个人AI计算机。

一起来看个人AI计算机长啥样:

在这个架构中,依次有输入输出、记忆器、控制器、运算器和存储器。

其中,控制器相当于整个系统的“大脑”,是真正理解用户意图、并对复杂任务进行拆解,以及调度不同执行单元来完成用户任务的部分。

在这个部分里,为了模拟人的思考过程,又存在评估器和决策器。

与此同时,控制器还会不断和外界进行交互,通过多轮对话等方式,需要用户不断提供新的信息,形成反馈,然后整个系统不断进行迭代、循环。

而个人AI计算机作为kOS的实现目标而存在,被称为计算机,是因为它符合冯·诺伊曼架构,从设计之初,就符合信息论、控制论和系统论的结合。

  • 首先,从系统论角度来说,kOS在追寻对神经网络和高级编程语言两者的统一;

  • 其次,公布出的架构里,kOS有模拟人类思考的过程,符合控制论的设计思想;

  • 再者,kOS满足信息论则体现在架构能够通过数据脱水和数据浸泡产生结构化数据。

这里多提两句,数据脱水和浸泡也是KMind提出的新概念。

继续用《西游记》来举例子。数据脱水,就是把整本书先进行数据挖掘,生成结构化数据——这个过程本身就调用了多次计算,且计算可能来自于小模型,也可能来自于大模型。

产生结构化数据后,就可以根据用户的逻辑或需求,在任意尺度上对其进行精确控制,随意替换掉需要部分的“零件”。

脱水后的结构化数据去除掉了冗余信息,最终以一个跟信息熵相关的指标,来衡量AI操作数据的精确程度。

修改后的结构化数据会被评估“是否对原有数据造成了破坏”,如被破坏,则在AI精度上继续迭代修改。最后将数据还原,或生成为用户可读的数据形态。

能解决什么问题?

对精确部分进行修改,就像AI绘画过程中,利用ControlNet插件精确控制手部区域进行修改,直到满意,再也不用整体推翻重新再来了。

如此这般,大模型的幻觉和精度问题,至少能在现在得到缓解

这也是个人AI计算机为自己赋予的使命之一。

“之一”意味着它的作用并不全在此。

个人AI计算机被视为一个全新概念,是因为它的目标是把个人计算机“小型化、普惠化,让每个人都用得起”。

这与现在的个人计算机迥乎不同:在此之前,互联网把一个个个人计算机连接在一起,全球的数字化信息由此可以在互联网里高速流动。

但信息汇集,产生了超级节点,数据也渐渐被互联网巨头垄断。

在KMind团队看来,这十分不合理,用户贡献了数据,但数据垄断后的收益都是互联网寡头的;数据垄断还会进一步带来互联网的割裂,不仅降低用户体验,还违背了互联网互联、自由的属性。

因此,个人AI计算机一方面想解决大模型不能解决之痛,另一方面,还希望能解决由于信息聚集在Google这样的超级节点导致的数据垄断、互联网割裂等问题。

开启这个目标的第一步,KMind就表示自己的商业模式不会是通过广告业务实现。

如果这个公司的商业模式是广告,很难避免自己不作恶。

同时,团队也明确表示不会拿用户的数据训练自己的模型,也不会将属于每个用户的数据综合后形成一个通识AI。

在团队规划中,KMind的商业模式是这样的:

KMind提供算力,程序员用户提供算法,用户提供数据,且数据永远归用户拥有。

吴翰清强调,这是一个良性的生态结构,他同时也强调,个人AI计算机里的推荐和检索算法都会被开源,并由一个开源社区来维护。

“如果有一天半个宇宙居然想要把这些闭源掉,那我也号召所有半个宇宙的居民来推翻它,因为从那一天可能就是它作恶的开始,它又开始从尝试不垄断数据走向了数据垄断。”

One More Thing

现在,KMind已推出了由kOS驱动的个人智能助理“星伴”。

每个用户和星伴将是伴生关系,按照用户的意图,星伴会为自动为用户工作,或陪用户聊天。

和其他可调用AI不同,星伴是可编程的,具备成长性,它所经历的个性化知识、经验、记忆、性格会被保存在一个叫“星魂”的地方,最终形成属于每个人的数字资产。

一旦经过允许,你可以调用其他人星伴里的知识,最终形成一个庞大的AI社区。

也因为星伴的存在,人的在线时间不再受制于睡眠和休息,AI会帮你时刻在线,只要提供了数据,AI就能开放式的回答所有问题,永不停歇的服务、沟通、协同。

想想有点激动,感觉有了星伴,本打工人的摸鱼时间一定能更多了吧……(doge)

— 联系作者 —

—  —

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
绿色热土 – 巴西游记《推开这扇门》&《又是一年冬天》AI早知道|Stability AI推出最小模型;国内首个视频大模型通过备案;内蒙古首个AI大模型工业互联网平台发布免费《大模型应用实践》实训营第二周课程来啦!这次百度算法工程师团队手把手教你构建大模型应用,另有第一周干货回顾!《西游记》才是第一禁书!尘封300年只为掩盖一个秘密!谷歌AI通过图灵测试,大模型医生来了?GPT-4竟诊断出难倒17个医生的怪病美国要内战?纽约给难民发钱引众怒,得州拒收难民上武装和总统硬刚!炸锅!留学生给难民腾地方?加拿大移民部拿国际留学生开刀!2024年狂减35%...中国已经有238个大模型了?李彦宏劝各位少做点大模型多搞搞应用吧6048 血壮山河 卢沟桥之变 17免费大模型实战课|首周聚焦百度智能云千帆大模型平台使用,《大模型应用实践》实训营11月16日开讲!西游记中的资产负债表衰退一颗难倒了苹果的芯片留学生给难民腾地方?加拿大宣布三项新政拿国际留学生开刀!2024年狂减35%...打通大模型训练任督二脉!国内首个千亿参数、全面开源大模型来了,还联手开发者共训GPT又迎重磅升级!万物皆可大模型(赠大模型系列课程+书籍)清华、哈工大把大模型压缩到了1bit,把大模型放在手机里跑的愿望就快要实现了!把大模型装进手机,AI帮我打工更容易了苹果大模型最大动作:开源M芯专用ML框架,能跑70亿大模型突然明白了为什么《西游记》里的女妖精,大多数都想和唐僧拜堂成亲《西游记》片头曲该怎么唱?别吵了,五度标调法有话说!《英语900句》主持人何丽达去世《寻梦环游记》太奶奶配音演员去世;蒋奇明新片《7天》首曝海报30年前上海贵妇就穿三宅一生?《繁花》把多少打工人看馋了大模型推理乘上RISC-V快车?国内AI芯片创企推大模型系列一体机突发!澳洲连夜官宣移民噩耗!明起,大批华人被禁申请!人口激增,PR更难了!政府送出3000签证给难民,但是还是有些好消息的...千元成本搞定专业大模型,系统优化+开源大模型是关键 | 潞晨卞正达@MEET2024传字节成立AI应用新部门Flow;淘天集团筹建大模型团队;浪潮信息开源千亿级大模型丨AIGC大事日报你们这群人真的是饿了!西游记白看了【动脉严选新品鉴第37期】百度灵医大模型:国内首个产业级医疗大模型把大模型塞进 iPhone,苹果的这篇论文给出了突破性方案2023创业家年会关键词是“AI”;百度发布Q3财报;拼多多成立大模型团队;字节飞书接入大模型;比尔·盖茨最新分享AI早知道|百度推出视频生成模型UniVG;Soul APP上线自研语言大模型;清华大学首个大模型 DebugMemory of this day留学生给难民腾地方?加拿大移民部拿国际留学生开刀!2024年狂减35%...夏婳:两情难相知(完结篇)
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。