Redian新闻
>
黄学东分享:Zoom AI如何正确地「碾压GPT-4」

黄学东分享:Zoom AI如何正确地「碾压GPT-4」

科技



  新智元报道  

编辑:润
【新智元导读】Zoom AI通过独创的「联邦AI」的技术路线,联合多个大模型,在特定任务上超越GPT-4,体现出了多个大模型互帮互助的强大能力,而且成本也能控制在GPT-4一半的水品。

去年底,从微软离职加入Zoom的华人AI大佬黄学东以Zoom CTO的身份发表了一篇技术博客,介绍了Zoom推出的联邦AI技术——

差异化地利用不同成本的AI工具,让能力强成本高的AI完成难度大的任务;成本低能力弱的AI完成简单的任务,从而在完成质量和GPT-4几乎一致的前提下,将AI完成任务的推理成本降到了GPT-4的6%。

在去年底,对标GPT-4,Zoom AI就做到了「质量一样,成本打1折」!

文章地址:https://www.zoom.com/en/blog/federated-ai-approach-best-quality-for-most-popular-features/

3月26号,黄院士又发表了一篇新的技术博客,宣布联邦AI技术取得的最新进展:

通过整合Claude 3等新推出的强力LLM,「联邦 AI」在特定的任务场景中,完成质量已经超过了GPT-4——

在Zoom提供的会议摘要功能「Meeting recap」上,Zoom AI的结果相比GPT-4将错误率减少了20%,在自动预测下一步操作的「Next Steps」上,Zoom AI的正确率提高了60%。

具体来说,Zoom AI将市面上的所有可用的LLM都整合了起来。

集众家之所长,从而在产品层面做到了质量「碾压GPT-4」!

这样的技术路径不但大大降低了使用大模型的成本,而且随着市面上不同公司的大模型性能的变化,可以灵活选择最适合任务的模型进行搭配。

从避免了与某一个模型深度绑定后,反而限制了产品服务质量的情况。

在Zoom最新的内部基准测试中,通过让人类评委盲选最准确的会议摘要的方式进行了测试。Zoom LLM和Claude-3配合下在会议总结和提取下一步操作两个任务上的表现都优于英文版的GPT-4。

将Zoom LLM与GPT-4总结日语会议的结果相比较。Zoom LLM也能够提供更好的结果,降低了接近15%的错误率。

根据Zoom委托GigaOm进行的一项研究显示,Zoom AI Companion的会议转录的准确率高达95%以上。

在会议提问场景中,Zoom AI Companion提供的结果比ChatGPT-4 web快四倍。

而在安全性上,Zoom AI组建一个由Claude-3、Gemini和GPT-4等多个LLM组成的「委员会」,降低了大多数LLM输出的固有偏差,从而减少了幻觉,进一步提高了输出的质量。

最主要的原因是不同的LLM不太可能犯同样的幻觉错误,所以Zoom LLM可以生成更一致的回应,进一步减少幻觉的影响。

而且根据黄院士透露,在性能表现超越GPT-4的任务中,推理成本有所上升,但依然只有GPT-4一半左右。

虽然要取得超越GPT-4的性能,Zoom AI成本要比去年底的「成本打一折」时高上不少,但是依然比仅仅使用GPT-4要便宜很多。

参考资料:

https://www.zoom.com/en/blog/federated-ai-approach-best-quality-for-most-popular-features/



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
吴恩达:别光盯着GPT-5,用GPT-4做个智能体可能提前达到GPT-5的效果【本周讲座预告】留学生遭遇的糟心事,如何正确应对OpenAI日本办事处成立,定制「日语版GPT-4」发布!留学生如何正确使用OPT可以更大几率留在美国?2024新加坡最佳雇主榜单出炉,香港城市大学东莞校区开放申请神秘GPT模型引爆社区,GPT-4.5、GPT-5谣言满天飞,奥特曼在线围观【Zoom讲座】媒体多元:亚太群体之声,5月14日,星期二,晚上19:00 -20:30OpenAI神秘搞事,GPT-4.5默默上线?推理碾压GPT-4网友震惊,奥特曼笑而不语先更好地「成为自己」,再成为更好的咨询师 | 人本主义突发:Zara中国大量关店 撤出东莞 西安剩两广州剩三「中国新说唱2024」全员尿检 参赛者排队交尿画面流出【Zoom活动】网络时代的新闻媒体,5月6日,星期一,晚上19:00 -20:30今日帖,今日读——— 2024年1月31日UCLA华人提出全新自我对弈机制!LLM自己训自己,效果碾压GPT-4专家指导ChatGPT 之父最新专访:发现 GPT-4o 惊喜用途,下一代模型可能不是 GPT-5「母亲影展2024」闭幕之颁奖 | 「草场地创作奖」 「妈妈选择奖」「观众选择奖」刘强东分身直播带货,给大家“开了个会”加州女子在家开Zoom会议遭丈夫枪杀48、长篇家庭伦理小说《嫁接》第十二章 初恋情人(1)精选SDE岗位丨Zoom、Amazon、Ciena Corporation等公司开放岗位!AMD 发布锐龙 8000 系列嵌入式处理器:Zen 4 架构,集成 NPU聪明人如何正确决策?|【经纬低调分享】外企社招丨ZOOM社招岗位上新!视频会议领域独角兽,月薪20-45k,六险一金,多样福利,适合留学生ZOOMiN会饮阅读会:走进马斯克内心,让我们一起谈谈爱【Zoom活动】气候变化简介:从热浪到全球变暖, 4月21日,星期日,早上10:00-11:30生命的美好不可辜负旅行的尽头是日本(6)国立新美术馆首个全开源时序预测基础模型:Zero-shot预测能力比肩从零训练最优模型对什么都淡淡地「算了」,可能和抑郁有关【广州美国中心活动】【Zoom活动】2024征途:大选中的媒体角色,5月22日,星期三,晚上19:00 -20:30全球首个「开源GPT-4」出世!Llama 3震撼发布,Meta AI免登录可用阿克顿勋爵:每个时代的自由,都面临四大挑战Over 70% of Trip.com Staff Choose Working From Home华人在美生活,常见的各类意外车祸赔偿八大误解,如何正确索赔?ChatGPT 大更新曝光!免费用户自动升级 GPT-4 ,还能创建 GPTs
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。