Redian新闻
>
Google 下一款 ChatGPT 竞品曝光:投入或超GPT-4,AlphaGo 成秘密武器

Google 下一款 ChatGPT 竞品曝光:投入或超GPT-4,AlphaGo 成秘密武器

科技

ChatGPT 的大火,可把 Google 急坏了。
要知道 ChatGPT 中的「T」表示的是 Transformer 模型,出自于 Google 研究团队,而现在这一技术在竞争对手 OpenAI 的手上发光发热,这令 Google 颇感尴尬。
为应对这一挑战,Google 迅速推出了自己的聊天机器人Bard,并且开始整合 AI 资源,合并了两大研究团队 Google Brain 和 DeepMind,创建了 Google DeepMind,由 DeepMind 原 CEO Demis Hassabis 领导。
Hassabis 表示 Google 有 80% 或 90% 的 AI 创新都出自于这两个团队。
在 上个月的 Google I/O 大会上,Google CEO Sundar Pichai 官宣了一个重磅消息:Google DeepMind 正在研究一个全新的大语言模型,代号为 Gemini(双子座),这也是这两只团队合并后首次合作的项目。
近日,Demis Hassabis 在接受 Wired 的采访了透露了更多与 Gemini 有关的消息,这可能是 Google 向 OpenAI 反击的关键战役。
正在追赶的 Google
此前大家猜测,Gemini 和 GPT 模型类似,都是有着出色文本处理能力的大语言模型,两者的差异可能会体现在训练参数的规模上,模型规模越大,处理能力可能就会越强。
然而 Hassabis 表示,Gemini 有很多不太一样地方,例如 Google DeepMind 团队正在将 AlphaGo 中使用的技术结合语言模型,以赋予更强的规划或解决问题能力等等。这可能会成为 Gemini 的「杀手锏」技能。

抽象来看,你可以将 Gemini 看作是将 AlphaGo 型系统的一些优点与大模型的语言能力相结合。我们还有一些新的创新,这将非常有趣。
2016 年,横空出世的 AlphaGo 击败了围棋冠军李世石,让全世界第一次真切地感受到 AI 技术的震撼。
AlphaGo 的技术基于一种名为「强化学习」的训练方法,通过反复试验和反馈来学习如何解决问题,它还使用了一种称为树搜索的方法,探索并记住可能的走法。
Google DeepMind 团队希望将这些技术应用到语言模型中,使它们能够在互联网和计算机上执行更多任务。
DeepMind 在机器学习和强化学习有着丰富的经验,开展过多项重要的研究,包括:
  • AlphaGo:第一个击败人类世界冠军的围棋程序。AlphaGo的成功标志着AI在处理复杂策略游戏方面的重大突破。

  • AlphaZero:AlphaZero 是一个通用的强化学习算法,可以在没有任何先验知识的情况下,仅通过自我对弈学习如何玩棋类游戏。AlphaZero已经证明了其在国际象棋、将棋和围棋等游戏中的超强实力。

  • AlphaFold:AlphaFold 是一个可以预测蛋白质结构的深度学习系统。这个系统的准确性在生物学领域引起了广泛关注,因为它可以帮助科学家更好地理解疾病,并加速药物的发现和开发。

  • WaveNet:WaveNet 是一个深度生成模型,用于生成自然 sounding 的语音。它已经被广泛应用于语音合成和音乐生成等领域。

  • MuZero:MuZero 是一个无模型强化学习算法,它可以在没有环境模型的情况下,通过预测其动作的结果来学习策略和价值函数。MuZero 已经在多个任务和游戏中表现出了超强的性能。

DeepMind 在强化学习方面的深厚经验可能会为 Gemini 带来超越 ChatGPT 的新能力。
Hassabis 表示,Gemini 模型仍在开发中,这个过程将需要几个月的时间,可能花费数千万或者上亿美元。作为对比 OpenAI CEO Sam Altman 在四月份表示,创建 GPT-4 的成本超过了 1 亿美元。
Gemini 不仅仅是对 ChatGPT 做出的防御之举,还将是 Google 未来部署搜索等产品的技术基础。
Hassabis 表示,AI 的非凡潜在益处,例如健康或气候等领域的科学发,人类必须不停地发展这项技术。如果运用恰当的话,AI 将是对人类最有益的技术。
我们必须大胆且勇敢地去追求那些东西。
Google 不为人知的「护城河」
在 AI 研究方面,Google 还有一张盖住的王牌——全球最大的视频网站 YouTube。
视频是个非常多元的内容载体,我们可以把它分解成图像、音频和文字记录。Google 拥有 YouTube,也就意味着拥有最丰富的图像、音频训练内容。
根据 The information 报道,有内部人士透露 OpenAI 早已经悄悄地使用 YouTube 上的内容来训练其人工智能模型。
Google 自然不会忽视这座「金山」,The Information 继续爆料称 Google 的研究团队也在利用 YouTube 训练 Gemini 模型,并且 Google 能够比竞争对手们获得更完整的内容数据。
对于大语言模型来说,高质量的训练数据比黄金还要宝贵。
由于 YouTube 很多都是真实的对话,Google 可以利用 YouTube 视频的音频文本或描述作为训练 Gemini 的另一个文本来源,从而提高它的语言理解能力,并产生更加真实的对话反馈。
利用 YouTube 的视频内容,Google 还可以开发出类似于 Runway 用文本生成视频的多模态功能,用户只需要输入他们的描述就能生成出一条精美的视频。
除了制作视频,多模态模型还可以有更多的可能性,例如可以根据 YouTube 视频直接总结出球赛的亮点,或者根据视频帮助机械师诊断汽车修理问题。
OpenAI 在发布 GPT-4 模型时,曾展示过从草图生成网站代码的功能,这也是多模态模型的一个重要应用领域。
前 YouTube 高管 Shishir Mehrotra 表示,对 Google 来说,YouTube 视频简直就是一座数据金矿。
这不仅仅是因为视频的存在,而是因为视频存在于一个生态系统中。
YouTube 上的视频向 AI 展现了了人类是如何进行对话,这和书面化的文本有很大的不同,可以帮助模型更好的理解人类对话的逻辑,并生成更恰当的反馈。
不仅如此,Google 还收集大量的用户互动数据,清楚用户对视频的那些部分最感兴趣、哪些部分容易跳出、哪些内容会吸引用户评论等等。
据统计,YouTube 每分钟就有 500 小时的视频上传到网站上,Google 可以说是坐在了一座会源源不断生产金子的金山上,这或许会成为 Google 真正的护城河。
多模态才是未来
随着多模态模型越来越受到重视,未来会有更多的开发人员选择用视频训练语言模型。AI 教父、Meta AI 首席研究员 Yann LeCun 在近日一条推文中称:「通过视觉学习世界如何运转的系统,将对现实有更深刻的理解」,并称赞了 Meta 在这一领域的研究成果。
著名风投机构 A16Z 在最近采访了四家明星 AI 公司 AnthropicAI、Cohere、Character AI、AI21Labs 的 CEO 和创始人,探讨出生成式 AI 当前最需要突破的四个方向,分别是操控、记忆、四肢(访问浏览器等)和多模态。
这四项关键关键创新将主导 AI 在未来 6 个月到 12 个月的发展,这也会影响公司和开发者改变构建产品的方式。
Cohere 的 CEO Aidan Gomez(著名论文《Attention is all you need》的主要作者之一)表示,AI 系统的能力终究是有限的,因为并非所有的内容都是文本形式,因此多模态能力对于大语言模型来说是个重要的发展方向,像 GPT-4、 Character.AI 和 Meta 的 ImageBind 等模型已经在处理和生成图像、音频等内容。
我们现在的模型确实是字面意义上的「盲人」,这需要改变。
Aidan Gomez 在采访中总结道。

多模态模型能够极大地拓宽 AI 的应用场景,例如可以用在自动驾驶汽车或其他需要与物理世界实时交互的场景上。此前,Google 在 I/O 大会发布的 Med-PalM-2 模型便展示过可以分析 X 光照片的能力。
这也让人更加期待,更强大的 Gemini 能在多模态领域给我们多大的惊喜。现在看来,暂时取得领先的 OpenAI,远没有到停下来休息的时刻。


点击「在看

是对我们最大的鼓励

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
IBM加入战局!任意大模型低成本变ChatGPT方法开源,个别任务超GPT-4王炸升级!Google 全新大模型赶超 GPT-4,Bard 全面开放,要把搜索彻底颠覆科技巨头年薪曝光!Meta反超Google排第一!ChatGPT 干倒了补习班股票, CHGG 近乎腰斩Google新大模型赶超GPT-4/理想一季度交付量创历史新高/阿里巴巴取消首席技术官职位Threads用户破亿,会是下一个Google+吗?OpenAI 和 Meta 被起诉;中国通缩风险加剧..特斯拉 11 天涨 2000 亿美元;Meta 推特竞品曝光;宁德时代快充新进展:充 10 分钟跑 400 公里 | 极客早知道【广而告之】还有留学生不知道吗?用ChatGPT订机票,竟然比Google Flight和Expedia还要便宜!Google 疯狂的一周才刚结束,ChatGPT 下周又要大更新|Hunt Good 周报Google创始人回归打造更强大模型/ChatGPT Android应用下周发布/AI巨头承诺负责任地开发AI |灵感周报ChatGPT最强竞品Claude2来了:代码、GRE成绩超越GPT-4,免费可用每周硅闻 | 硅谷最不受欢迎雇主又曝丑闻;IT工程师遭Google警告;ChatGPT降价了!​从“Dr Google”到“Dr ChatGPT”,在线自诊真的可靠?Google内部文件首次泄漏:ChatGPT 没有护城河,开源才是大模型未来上个世纪50年代中国大陆陆军的装备的两款加农炮【活动推广】ENC : 还有留学生不知道吗?用ChatGPT订机票,竟然比Google Flight和Expedia还要便宜!ChatGPT 突然被 block 了曝PwC向Google泄露政府税改机密!Google已承认涉案AI之下没有秘密:网友诱骗ChatGPT激活 Windows 11,ChatGPT落入陷阱!巴黎市长将重修Châtelet 广场以方便行人每周硅闻 | Meta预告第三轮裁员;Google遭遇严重威胁;马斯克成下一任美国总统?Chatgpt 图片识别能力超越人类了啊,谁第一眼看走眼的举手ChatGPT 最强竞品 Claude2 来了:代码、GRE 成绩超越 GPT-4,免费可用八声甘州 不必追忆精选MLE岗位 | Google、Apple 等公司持续热招!学习美国宪法Meta反超Google:开出$300000价码!Google 内部文件泄漏:我们和 OpenAI 都没护城河,开源可以打败 ChatGPT尹锡悦:要悬Google 本周或发布新大语言模型/iPhone 16 Pro 或采用固态按键/百度旗下小度将发布智能手机【城事】巴黎市长将重修Châtelet 广场以方便行人Perplexity AI,比Google Bard和Bing Chat更靠谱的问答引擎塾字源考Google 刚刚发布手机、平板全家桶!现场体验后有点失望ChatGPT路线图曝光:没有GPT-5、识图功能要等到明年、GPT-3或将开源世卫将阿斯巴甜列入可能对人类致癌物/Google版ChatGPT支持中文 /《奥本海默》口碑解禁ChatGPT 美国用户人群画像出来了:年轻、富裕、受过良好教育从AlphaGo到GPT-4,AI迎来技术应用新浪潮Google 已经被OpenAI 超越了吗?| AlphaGo 之父深度访谈谷歌打响AI反击战:新模型赶超GPT-4,安卓和Pixel都成配角
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。