Redian新闻
>
大厂悄悄放大招!用APPAgent替你使手机!鹅厂这回整挺好

大厂悄悄放大招!用APPAgent替你使手机!鹅厂这回整挺好

科技

 点击订阅,抓住风口

你好,我是王煜全,这里是王煜全要闻评论。

最近一提到腾讯,大家的反应就是股价大跌,游戏业务受重创,但是,他们却悄悄发布了新的AI研究,这事也不容小觑。

12月21日,腾讯团队发布了一篇论文,题目是《AppAgent:像人类一样操作手机的多模态智能体》,还顺便把代码开源了。

顾名思义,AppAgent就是一个替你操作手机APP的机器人。之所以叫多模态智能体,是因为它利用GPT-4 V的视觉理解能力,像人一样用“眼睛”来看APP界面,然后学习人类的操作方式,学会之后就可以自己玩手机了。

他们在10款APP上测试了50种操作,AppAgent都完成了任务。比如,在谷歌地图里输入“腾讯上海公司”,然后设置导航路线;在Gmail邮箱里写邮件,询问同事的工作情况,然后发送邮件;还能在修图软件Lightroom里自动修图。

更有趣的是,AppAgent学习使用APP的逻辑都和人类非常像。

试想一下老人学习使用智能手机的情景,他们看到陌生的操作界面,会先理解一下各个按钮都是做什么用的,然后点一点试一试,如果自己实在搞不懂,就会让年轻人帮忙演示一遍。

AppAgent也是如此,研究团队给它设定了几个常用的APP操作方式,比如点击、长按、上下左右滑动、输入文字和返回,之后,它就靠GPT-4 V的视觉识别和理解能力自己探索了。

它的探索分为两个步骤:“自主交互探索”和“观看演示探索”。“自主交互”就是把APP界面中的各种按键、功能都试一遍,看看点完按键会产生什么样的结果,然后与几个默认动作匹配上,比如搜索框需要先点击一下再输入文字,最后它会自己创建一个特定APP的操作指南,以后按指南走就行了。

不过这种方式有点慢,就需要“观看演示探索”。也就是人类帮它演示一遍,快速学习各种按键的操作方式和逻辑,有些不需要点击的地方就不用再浪费时间探索了。

你看,这简直和人类学习APP的流程一模一样,都是靠眼睛看、动手试、再请别人教。打通了这样的底层逻辑,现在可以学会10个APP,未来就可以学会成千上万个APP,甚至有可能完成更加复杂的操作。

这就意味着,我们以后使用APP的时候可能不需要点来点去了,动动嘴就可以让AppAgent帮忙了。

比如,有些APP的发票管理功能隐藏得非常深,以后可能就不用自己费劲找了。如果再发散一下,是不是像王者荣耀、原神那样需要复杂操作的游戏也可以让AppAgent来玩呢。

我一直认为,大模型的真正机会并不是大模型本身,AI Agents才是潜在的机会方向。

腾讯的AppAgent就走在了正确的方向上,这项研究并没有纠缠在底层模型上,而是直接利用GPT-4的能力,开发出了实用的功能。这非常值得鼓励,也值得很多创业公司思考。

不过,腾讯并不是创业公司,他们还有更大的资源可以利用,比如微信、QQ等庞大的社交平台,这里面又有什么样的想象空间呢?

实际上,AppAgent就是一个替你操作手机的分身,就像自动驾驶汽车一样,当你懒得操作手机的时候让AppAgent来接管,成为“自动驾驶”手机。

现在有很多手机厂商在系统里植入一些AI聊天、AI修图功能,声称自己是AI手机,还有电脑厂商说自己的产品是AI PC。

但是,能够像AppAgent一样自动操作APP,才更像是AI手机,而未来也可能出现电脑版的AppAgent,因为操作逻辑都是相似的。

这就意味着,手机端、PC端的智能Agent有可能改变APP的操作方式,甚至改变应用开发逻辑,我们很可能迎来新一轮的智能应用变革。

QQ是腾讯在互联网时期的拳头产品,微信是他们在移动互联网时期的杀手锏。马化腾曾说,如果没有微信,腾讯可能面临灾难。

现在,人工智能革命的浪潮席卷而来,对腾讯这样的互联网大厂同样是一轮新的考验。方向对了,在操作上是否也能做对呢?

企业做大了就要平台化,腾讯平台以前的问题就是相对封闭,但是,现在已经是一个生态化协作的时代了,希望在AI时代腾讯能够加强开放性。有没有可能不止自己开发AI Agents,而且将自己的平台资源开放出来,允许与第三方开发的AI Agents的相互调用,甚至让多个AI Agents进入到平台里,让AI与人们互动,为人们提供服务,甚至成为人们的朋友。

我们曾经畅想过,随着AI Agents的发展,未来每个人都会有多个人工智能好友。它们凡事都会为你着想,既是你的知心好友,又是比你学识渊博的导师。不仅能帮你操作手机,还能和你一起玩游戏,帮你写作业、帮你工作。所以,每个人的人工智能好友可能比人类好友都多。腾讯什么时候能够允许第三方开发的人工智能好友出现在微信的好友列表里,也是他们开放态度的一个晴雨表。

关键在于,这很可能会进一步催生社交媒体平台的新形态。但是,大厂们即使理解AI Agents的价值,自己开发也未必能成为未来的赢家,而开放合作,既对创业公司是个福音,也是对自己平台地位的巩固。

以上是今天的内容,更多详细的产业分析和底层逻辑,我会在科技特训营里分享。欢迎关注全球风口微信号,报名加入!

另外做一个预告,本周日的前哨AI小课中,主讲人Tina将会讲解如何用开源AI项目做漫画、换脸、换衣服,Tina帮我做了一张穿上钢铁侠装甲的效果图,我已经用来做微信头像了。如果你也感兴趣的话,就扫描下方课程海报中的二维码,报名加入吧。

王煜全要闻评论,我们下周见!


我们还整理了一份”60个开源Agent项目”清单辛苦你点下“赞”和“在看”,点击顶部的“进入公众号”,在对话框里发送“科技”二字,你就会获得这份清单。
清单每天更新,所以请跟上全球风口的节奏;如果想要所有行业清单,扫码加入科技特训营,分分钟尽在掌握!

【科技特训营】全新的会员订阅制线上书院模式,全年50次“在线直播课程+私享群互动”,你随时可以加入、我持续保持更新!一起互动,伴随成长!让我们为未来五年做好准备,一起探讨把握机遇,决胜未来!


前哨AI小课
长按扫描二维码加入

1. 前哨科技特训营直播课程第四季(2023年)共50讲+,除此之外还有5节加餐+公开课。
2. 每讲承诺为1小时视频内容,实际平均时长为2小时。
3. 每周四晚八点准时直播,会员可无限次观看回放。
4. 新入会员,可以无限次回看之前所有视频课程。
5. 成为会员即可使用【AI王煜全】,最新AI大模型开发的专属科技分析助手
6. 每周组织【前哨·创新启发局】,链接科技/产业一线人士,打开技术/应用前沿视野
7. 优先获取全球科技产业一线游学、访问机会,接触科技/产业专家,获取最新、最前沿的趋势洞察,人脉链接
8. 本课程为虚拟内容服务,年费订阅服务制。一经订阅概不退款,线下活动需另行支付差旅成本,请您理解。

课程咨询】
请加“创新地图助手”:
微信:innovationmapSM

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
偷摸放大招!Lululemon半夜悄悄打折+补货...沃顿放大招!这门线上估值建模速成课,留学生免费!放大招!明起实施,证监会宣布全面暂停!别漏了!Lululemon半夜放大招,悄悄打折+补货...广东放大招!剑指3000亿元,AI利好!放大招!巴黎圣母院860周年珍藏版干红,手工蜡封,果香馥郁,自用送人太有品味!Lululemon半夜放大招,悄悄打折+补货,我下了一单又一单...香港高才通A类悄悄放宽要求,公司持股50%也可拿香港身份Lululemon半夜放大招,悄悄打折+补货,晚了就没了...联手A股千亿巨头,华为又放大招!放大招!新加坡推出全新人才签证,这届英国留学生躺赢!快来看!加拿大Walmart龙年春节又悄悄放大招了...6042 血壮山河 卢沟桥之变 11《编织梦幻的人·夏加尔篇之二》重磅!ChatGPT放大招!GPT Store应用商店今天上线!超300万GPTs,内卷之下的赚钱机会!精神状态,挺好的呀挺好的呀挺好的呀挺好的呀挺好的呀挺好的呀挺好的呀挺好的呀挺好的呀挺好的呀挺好的呀挺好的呀挺好的呀挺好的呀挺好的Target突然放大招,新一波黑五价今!天!开!抢!刚刚,蚂蚁放大招!谷歌深夜放大招!最强大模型Gemini能打败GPT4吗?放大招!奢牌经典旷野男香礼盒三件套,又高级又撩人!hé bàng?hé bèng?《逃离横滨》 下比亚迪再放大招!Meta生成式AI连放大招:视频生成超越Gen-2,动图表情包随心定制蚂蚁放大招!谷歌连放大招:Gemini Pro支持中文,Bard学会画画;库克:苹果将在今年晚些时候推出生成式AI功能丨AIGC日报华为放大招!余承东:新车将高能登场!曾称其超越特斯拉……五粮液龙年贺礼放大招!52°经典浓香臻·品陈酒,3斤大坛装不到1折!半夜鸡叫周扒皮和各国的工作时间广东放大招!利好这个行业放大招!央行、香港金管局重磅发布在巴黎乘地铁有诀窍吗?谷歌连放大招:Gemini Pro支持中文,Bard学会画画,还上新了新模型Apple这回憋大招,新款也参加!Target突然放大招!新一波黑五价今!天!开!抢!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。