Redian新闻
>
傅盛:大模型的弱点,才是我们的创业机会

傅盛:大模型的弱点,才是我们的创业机会

财经


内容来源2023年6月10日,由笔记侠在广州举办的“AI新视野,增长新势能”新商业千人大会。

分享嘉宾:傅盛,猎豹移动董事长兼CEO、猎户星空董事长。

:笔记侠作为主办方,经讲者审阅授权发布。

责编 | 聂敏

第  7490  篇深度好文:7453 字 | 16 分钟阅读

AI

笔记君说:


6月10日,笔记侠“AI新视野,增长新势能”新商业千人大会在广州举办。猎豹移动董事长兼CEO、猎户星空董事长傅盛,以《大模型时代,创业者的机会在哪里?》进行了主题分享。


在本次大会上,猎户星空推出的基于大模型技术的企业服务产品“聚言”(chatmax.ai),也首次对外发布。


时代在不断地改变,也在不断地催人改变。我想跟大家分享的主题是:大模型时代,创业者的机会在哪里?


我们都知道ChatGPT最近很火,他是人类历史上第一个仅用2个月,实现月活过亿的产品,最近月活已经突破10亿。这是在没有任何推广的情况下,完全靠用户主动使用,实现的自然增长。


其实这款产品只有一个聊天窗口(用户界面也并不出众),但为什么能在全球引发如此大的风潮?


今天我从原理层给大家解读一下。


最开始,我也跟大家一样,认为ChatGPT是一款聊天软件,它只是庞大的网络知识重新整合了一遍。


直到有一天,我突发奇想,问ChatGPT“你知道为什么我们家的狗叫三万吗?”我给了一个提示,它被前主人遗弃,我在宠物医院收养了它。结果,ChatGPT回复说,“是不是做手术的费用是3万,你们取这个名字是为了纪念这次手术。”


我当时很震惊,因为我收养它的时候都不知道它叫三万,是医生告诉我,以前的主人带狗来治骨折,结果一听手术费要3万人就消失了,后来医生就给它取名三万。


我突然意识到,这些信息网上搜不到,ChatGPT不是根据过去知识的总结,完全靠自己的推理得出结论


所以,ChatGPT看上去是一个聊天软件,但本质上,它是个具有推理能力的大脑。


一、为什么是ChatGPT?


我们从原理层,去看一下这个事情。


作为创业者,我们必须学习,但学习是要从底层原理开始。不能因为自己不懂技术,就不从原理层理解问题。不然你会容易被网上各种各样的信息带偏。


今天网上对ChatGPT的讨论很多,有人将它神话,有人产生恐慌,比如人是否要被替代它是否会产生自我意识。我认为这些都被过度炒作了。


从底层原理去理解,我的体会是:语义理解,是人工智能技术的皇冠。


我是有论据的,六年前,我们就投身人工智能,花了近10个亿去做研发,可以说积累了大量成功和不成功的经验。



我们讲“智能”这件事,人与动物的核心区别是什么?是语言。更具体一点来说,是对于抽象语言的理解和逻辑推理能力。


因为智能也分好多种,图像识别、人脸识别都是智能,但这种智能很多动物也具备,比如你家的狗看到你回家,会摇着尾巴欢迎你;昆虫看到花草就会飞过去;猎豹看到食物,会依靠隐蔽和速度来捕猎等等。


所以,“识别”不是人类独有的智能,语言才是。《人类简史》中有一句话,智人之所以能够成为这个星球唯一霸主,一个重要的原因是他们发展出了“虚拟”的语言。可以聊八卦,聊一些虚拟事情,其实就是对抽象语言有了理解能力。比如,“今天心情很emo”、“如果我再努力一点就好了”等等。


动物也有语言,但它们交流的都是“非虚构”语言,往往是属于或者部分属于事实,比如“河边有只狮子”、“前方有颗大树”等等。所以,只有“虚拟”语言,才是人类所独有的,也就是所谓逻辑。也是我们智能的最高阶体现。


但语言到底是个什么东西,其实人类自己都没有研究清楚。



前几天,我跟清华大学脑科学家刘嘉教授对谈,他说曾经有专家老师把人类语言学的所有规律都总结了一遍,你只要掌握规律,就可以轻松学会一门语言。但ChatGPT出来的时候,根本没有去学这套规律,而是直接自学,就掌握了多国语言


我们总结的那套主谓宾定状补,真的是语言的核心规律吗?这不好说,也没办法证伪。


有本书叫《大数据时代》,讲的是谷歌翻译团队,最早是由语言学家和工程师组成。但翻译效果一直上不去,后来开掉一个语言学家,翻译效果就好一点,再开掉一个语言学家,翻译效果又好一点。后来,语言学家全开掉,只剩下工程师们,谷歌翻译终于好用了。就算工程师都不认识阿拉伯文,但翻译效果一样好。


还有一个故事,就是图灵测试。图灵是一个非常伟大的科学家,他在100多年前就提出了这样一个实验理论,如何判断一个机器有没有人的智能?他想到了一个极简单的测试方法,就是在黑屋里放一个计算机,让人在不知情的情况下,跟计算机聊天。如果超过30%的成年人认为一起对话的是真人,那就说明计算机有了智能。


所以,ChatGPT看上去是一款聊天软件,但它真的像人一样完成语言进化,拥有了对抽象语言的理解能力。区别于只能完成机械指令的传统AI,ChatGPT能像真人一样聊天,有了智人才拥有的高阶智能。


另外,人工智能攻克语义理解的难度,是远高于图像识别的。虽然在理论学上,图像识别更需要底层能力,也就是deep learning(深度学习)。但从工程学上,最早斯坦福的两个研究生用一台GPU电脑,就把人工智能的图像识别能力提高了十几个点,开创了一个新的时代。


这次OpenAI花了6年时间、烧了20亿美金,才让计算机理解了人类的语言。在这之前,语义理解就是一条漫漫无尽的路,谁也不知道这条路还有多长。


《奇点临近》中说,2035年会出现硅基生命超越人类实现永生,以前我觉得这本书完全在胡扯,因为语义理解很难突破,以前对人工智能的总结是,“有多少人工,就有多少智能”,很绝望。


但没想到ChatGPT出现了,语义理解被攻克这也意味着,AI已经睁开眼,可以对这个世界进行对话了,AGI(通用人工智能)开始出现。


那ChatGPT是如何掌握人类语言的呢?我们再到原理层看一下。


语义理解的两条技术道路:“教育”神经网络和神经网络“自学”。



“教育”神经网络


即按人类对语言的理解,“教育”神经网络语法结构和知识图谱。

这更符合我们对语言学习的逻辑理解,像人族学习外语,投入就能见到效果。绝大多数互联网公司开发AI时,都会选择这条路,试图“教会”AI理解各种逻辑和规则。但问题是,统达到一定语言能力后(远低于人),无论如何优化,依然有大量的问题的回复完全是答非所问。


神经网络“自学”


是让神经网络学习足够多的文本,自动发现文本之间的规律。这就是OpenAI训练 ChatGPT的方式,没有严格的理论支撑,而且非常费钱,但没想到最后成功了。ChatGPT通过对海量文本的学习,自动构建了一个含有千亿参数的大模型,建立了对这个世界基本的逻辑认知,由此产生了基于逻辑的推理能力。


而在ChatGPT-3.0出现之前,OpenAI简直就是硅谷的笑话,很多人觉得就是一群神经病,烧着钱做一些费力不讨好的事情。结果没想到,AI自学语义这条路居然走通了,ChatGPT-3.0出来后,全世界都震惊了。


为什么之前ChatGPT一直不够智能?是因为投喂的数据还不够多。在我跟刘嘉教授的那场对话中,他也说道,ChatGPT的进化和我们人类大脑的进化有异曲同工之处。从动物进化到智人,花费了大约300万年,在此期间,人类大脑体积增加了三倍。而ChatGPT的突然开悟,也是因为人工智能被扩大了“脑容量”,参数增加到1000亿,就产生了智能。


另外,刘嘉教授一位在OpenAI工作的朋友告诉他,如果重新回到2017年,重新去搞大语言模型,未必能搞出现在的ChatGPT。


所以我们现在多用一个词,叫“涌现”,什么叫涌现?我们也不知道为什么ChatGPT突然“开悟”,只是把大量的文本信息灌给它,量变产生质变的情况下,它就开口说话了。所以,能造出涌现这个词,我觉得这也是人类语言的厉害之处。


由此,我们再来看看ChatGPT回答原理:当用户键入一段话,系统会根据这段话形成一个数学表达式去和大模型里的参数做匹配,产生关联概率最大的一个词,然后再以这个词和上面那段话继续以上过程。(注:所谓参数,简单理解,就是词和词之间的概率关系。


基于以上原理,GPT的回答都是即时生成的,不是拷贝和组合。


而OpenAI创始人有一次做访谈,也说训练ChatGPT的原理,就像读一本侦探小说。根据提示和关键信息,不断地推理、推翻,再推理,再推翻,直到最后结尾,真相才公布天下。


所以,训练ChatGPT,就是给它提示词,让它自己找文本之间的联系。你要做的,就是不断用提示词训练它,比如第一个回答完全答非所问,你要不断引导提问,直到答案逐渐接近,最后完全符合你的需要为止,它就记住了。


这个原理听起来很容易,但每次推翻再来,它的答案是要不断进化的。


所以,ChatGPT的强大,不仅需要技术和勇气,还需要很强的迭代能力。


二、我们该如何看,

ChatGPT带来的变化?


ChatGPT是第一款理解了人类语言逻辑的AI,通过文字理解了这个世界,拥有了推理和创造能力。


ChatGPT出现之前,对话系统更像鹦鹉学舌,虽然能够部分匹配内容,但是系统并不完全理解具体的含义,所以同一个问题换种说法,AI就会答不上来。而ChatGPT出现以后,对话系统是建立在对语义理解的基础上的,尽管也会说错,但都是“一本正经”的胡说八道。


当然,新事物出现都不是完美的,就像汽车刚出来没有马车跑的快,iPhone刚出来没有诺基亚好用。但底层范式的变化才是关键。一本正经的胡说八道,重点在一本正经,而不在胡说八道。一本正经说明他的逻辑是正确的,胡说八道可以通过专用系统来矫正(plugin)。


所以说,ChatGPT的出现意义重大,因为,它带来了交互革命和生产力革命。



1.交互革命


当AI可以听得懂人话,这就说明,以自然语言为交互界面的时代终于到来了。


人机交互界面将以自然语言为主,那么我们所有的设备、所有的工具,都可以重新做一遍,真正实现机器围着人转。而在这之前,我们大量的工作都是人围着机器转,比如,你要使用电脑,需要懂输入法,以及电脑的基本操作技能,才能让它运转。但这一次,是机器理解了你的语言,人只要下达命令,它就会为你提供服务。


比如,你想写一段编程但又没时间,可以让它帮你写,你晚上六点回家,想吃外卖,也可以让它帮你提前点好,安排送达等等。也许以后靠一部手机,仅用语音操作,就可以完成所有事情。



2.生产力革命


聊天只是ChatGPT能力的一个demo,大模型的本质是逻辑和推理能力,这种能力可以在任何需要脑力活动的地方发挥作用。这意味着,人工智能创造和创新的时代来临了。


我们知道,今天整个社会最重要的生产力是什么?是脑力劳动。而ChatGPT的出现,是人类第一次将电能转换成通用智力。这种能量转化,是区块链、元宇宙、互联网这些重塑生产关系的变革都没法比的,因为ChatGPT带来的是生产力革命,它诞生的意义不亚于蒸汽机的出现。


蒸汽机把热能转换成动能,人类由此进入工业化时代,生产力大幅度提升。而ChatGPT的出现,是将电能转换成了脑力和通用智力,增加了脑力劳动的不断输出。就如同你一插上电,就有了无数员工。


我记得有一次,我发抖音,说ChatGPT将带来生产力革命。底下有人评论说,你说生产力革命,那它会挖地吗?我说它不会挖地,但它可以跟挖掘机打通,更有规划和效率的去挖地。而且它不会停歇。


这就是生产力革命。今天硅谷的创业公司都发生了很大的组织结构变化,以前硅谷早期创业公司都是把钱用来招人,但现在钱一半用来招人,一半用来购买算力,以及各种与GPT相关的服务。


所以,马化腾以前认为ChatGPT是十年一遇的机会,现在认为是百年一遇的机会。


那大模型真的会颠覆人类?未来统治一切吗?目前来看,还不会。因为ChatGPT还没有生成意识,也没有好奇心和主动性,它所有回答都是根据人的提问,按照概率算出来的。它不会对写一堆代码感到难受,也不会对受制于人感到痛苦,这些个性和自我意识的东西还没有显现。所以,它还是一堆冷冰冰的代码。


也许ChatGPT以后会超越人类,统治一切。但目前来看,这些弱点还需要很长时间攻克。


所以,大模型的这些弱点,正好是我们的创业机会。


那未来行业会发生哪些变化呢?


第一个,就是大模型的核战争。我认为所有大公司都会参与到这场核战争中,他们会不断烧钱加码造出自己的大模型,因为大公司谁没有自己的大模型,就要被淘汰。


有很多人问,中国的大模型跟ChatGPT还有多大差距?其实没有太大差距,一年内基本可以追上,因为它的创新来自于公开论文,而且GPT-2.0已经开源了,一旦有人证明这件事可做,中国团队追起来的速度会非常快。


第二个,是平民化大模型。我相信,这会是大多数中小型公司的选择。因为大多数中小型公司的产品,不需要1000亿参数,也不需要爱因斯坦,只需要在特定场景下够用就行。比如做一个博物馆讲解机器人,100亿参数就可以了。


第三个,效率大提升,所有公司一定会产生巨大的组织变革,组织形式都会发生变化,效率将被极大提升。


第四个,陪伴和生成内容,互联网范式会发生变化,互联网的核心叫做连接信息,各行各业都将被深刻影响,“生成内容”将替代“链接信息”。


第五个,脑力劳动者将迅速被AI替换,技术、经验、创造力的壁垒将大幅度弱化,有任何问题都可以请教ChatGPT,它甚至会一步步引导你,掌握多个技能


以前是五年一小变,十年一大变,现在可能一两年就会发生很大的变化。就像蒸汽机出来后,汽车代替了马车,马车夫就失业了。而ChatGPT出现后,人工智能最先替代的会是一些脑力劳动者,尤其是中间层的脑力劳动者。



比如,我有一个朋友,以前他的游戏公司,1000多人有300多人的美术团队,但ChatGPT来了以后,300多人的美术团队,基本上都被裁掉了。


这次大模型带来的变革,整个社会的发展可能会产生翻天覆地的变化。包括我自己,心态上也产生了很多变化我们每个人都想在里面做些什么。


未来每个人该怎么办?还是要保持好奇心,主动学习。


那天问完我们家的狗为什么叫三万后,第二天送孩子上学,突然我就迷茫了。之前养孩子我都很佛系,觉得孩子爱干嘛就干嘛,只要愿意学就行。结果现在我迷茫了,孩子应该学什么,未来才不会被取代呢?


后来我想通了一件事,至少人类还有好奇心,还有主动学习和开放的心态。未来技能很快会被替代,但好奇心、主动学习能力、行动力是不会被替代的。


有一本书叫《正念领导力》,这本书,对我个人和我们组织帮助都很大,在此推荐给大家。


另外,行业创业者该怎么办?可以参考以下4个方向:


1.认真学习:认真学习ChatGPT和相关AIGC产品,不学习者必然成为马车夫;

2.熟练驾驭:熟练驾驭AI产品,成为新时代的魔法师;

3.保持热情:发挥人族的优势,保持热情、好奇心和想象力,脑洞目前还是优势;

4.千万别躺:千万别躺,生产力革命的年代,睡觉都是浪费时间。

因为AI向前发展一定是必然,技术变革任何人都阻挡不了。所以最好的建议,就是去学习新知识,留恋是没什么意义的,每个马车夫都该去学习开汽车,你要成为AI的驾驭者,而不是被它替代的人。


三、未来,创业者的机会在哪里?


那么,大模型时代,创业者的机会在哪里?我认为也有四个方向:


第一种,大模型直接用。你技术特别牛,拿大模型直接去做二次开发,但是对于非科技企业,也比较困难,因为要与程序员沟通,没有沟通语言;


第二种,基于大模型的工具产品,直接用。这是很多科技型公司在做的,各个行业像一些电商等企业,就适合直接采购科技公司提供的B2B服务;


第三种,私有化大模型。比较适合中小型企业,可能不需要很强的“大脑”,但能够处理特定场景需求,保证数据安全性就行,这类企业很适合定制自己的私有化大模型;


第四种,自研大模型。更适合资金、技术雄厚的创业者选择。


为什么互联网大厂一定会卷入自建大模型?因为大厂不可能将自己的核心数据接入ChatGPT,这会削弱他们的数据壁垒和核心竞争力,就像腾讯不可能把微信聊天信息交给百度,美团也不可能把外卖数据交给抖音.....所以说,未来互联网巨头的核心武器,一定来自大数据。


为什么要做私有化大模型呢?因为通用大模型,比如ChatGPT,会更加适用于广泛C端用户的碎片化需求,但对于B端企业而言,想要更符合企业调性、深度需求的产出,就会差点意思。


另一方面是数据隐私安全问题。模型微调、AI训练过程中的任何相关数据都有可能留存在公域大模型数据库中,但对于企业来说,许多私密数据并不能在给到公域大模型的ChatGPT来做训练,所以,一般企业会选择建立自己的私有化大模型。


目前,大模型已经是各个大厂的必争之地,而建立中国版“OpenAI”不仅需要勇气,还需要绝对的技术和资金实力。


对于没有雄厚技术和资金的中小企业,未来该怎么办呢?这也是我们最近一直在考虑的方向。猎户星空的基于大模型技术的企业服务产品“聚言(chatmax.ai),主要针对中小企业解决数字员工以及大模型等难题:


 

一是把大模型包装成工具产品,依据不同的行业知识和工作流程,为企业解锁客服、导游、财务分析师、法律顾问、合同审核员等不同领域的专家级数字员工;另一个就是基于底层技术,为一些中小型公司提供私有化大模型,比如垂直行业的大模型或者特定应用场景的大模型,几十亿、几百亿参数就可以搞定。


 

从“聚言(chatmax.ai)的技术原理来看:企业可基于公司业务数据、专业领域知识、私有信息等完成大语言模型的训练,比如律所需要具备全面的法律知识,财务需要专业的财税知识等,员工以自然语言描述完工作任务,大模型基于企业的业务流程,对交代的工作任务进行理解、规划,最后完成执行。



目前,猎户星空在AI机器人领域深耕六年,已经具备五大优势:


1.满足定制化需求:理解并掌握企业私有知识,使机器人能够使用企业知识进行回答,提升企业效率增加收益

2.打通业务系统融合业务数据打通企业各个业务系统获得更全面的数据视角,发现潜在关联模式支持自动化任务自动化客户服务提升服务效率满意度

3.业务流程自闭环插件机制融合大模型贯通企业服务流程助力企业完成服务流程自闭环

4.私有化部署保障企业数据安全私有化部署企业拥有更高的数据安全性和隐私保护,更好的性能稳定性

5.低成本可控:通过自研大模型和企业内部知识“聚言(chatmax.ai)建立了一个更适合企业的合理规模的语言模型,并且使用低门槛的算力配置,但实现了高效的自然语言处理能力。


猎户星空可以帮助千万中小企业打造专家级数字员工,让企业更高效。


在这百年一遇的生产力大变革时代,让我们一起去大力拥抱AI 2.0!谢谢大家。


*文章为作者独立观点,不代表笔记侠立场。


拥抱Al,帮助企业降本增效,
扫下方二维码领取精选干货合集

分享、点赞、在看,3连3连!

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
百度华为阿里等入选大模型“国家队”;盘古大模型3.0发布;阿里云推AI绘画大模型丨AIGC大事日报朱啸虎与傅盛隔空激辩,大模型创业价值消失了?朱啸虎、傅盛朋友圈“互怼”:创业者该不该逐鹿大模型;财经作家吴晓波微博被禁言;阿里回应分拆盒马上市;瑞幸咖啡新品被指侵权丨邦早报任鑫对话傅盛:万物皆可被GPT,行业重构,谁将被淘汰?启明创投周志峰:大模型中国创业机会很多,过度依赖API会失去竞争力丨GTIC 2023大模型与知识图谱融合?爱数推出基于大模型的领域认知智能产品与方案冷却的不止季节(51)— 母女深聊别拿女博士不当劳动力 (4)美团接盘王慧文:大模型创业的机会在哪?莫斯科之夜一览科技CTO陈锡言:大模型阴影下的技术创业机会——链接大模型与用户|量子位·视点分享回顾大模型颠覆研发模式:字节跳动是如何在单元测试中落地大模型的?朱啸虎VS傅盛,怼出了大模型创业的两个共识大模型的思想钢印:如何让ChatGPT相信水是有毒的?​中文信息处理实验室最新研究揭示虚假信息在大模型中的扩散机制稳稳拿捏爸爸的弱点,难怪他们会成为女儿奴首期AI治理与伦理圆桌:大模型的可解释性傅盛的大模型创业思考:好奇心和行动力才是竞争根本最好的赚钱方式,就是利用人性的弱点专访傅盛:百年一遇的机会,终于来了可复现、自动化、低成本、高评估水平,首个自动化评估大模型的大模型PandaLM来了只给大模型LeetCode编号,也能解题!大模型表现好是源于对训练数据的记忆吗?请不要迷信大模型傅盛:大模型普及化时代到来,应用开发者应笑醒在深夜观潮周报|美团收购光年之外;傅盛和朱啸虎激辩大模型创业马清运:西安有自己的底蕴,国际化是我们的新需求,不是我们缺失的东西!4/15/2023 5K Race施一公:中国教育的弱点,拖了科技创新的后腿重大事件谈:拜登的弱点傅盛:应用生态决定大模型公司的商业价值对话中国大模型的最早推行者黄铁军:全球可能只需要三个大模型生态吃主食减肥?是懒人的异想天开,或鬼才的创业机遇?|投资笔记Zilliz创始人兼首席执行官星爵演讲实录 | 向量数据库:大模型的记忆体NHL 2023 季后赛预测阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl女大学生“偷拍门”事件大反转:你以为的弱者,才是真正的霸凌者对话李志飞:大模型的关键在于如何把大模型用起来|年度AI对话
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。