Redian新闻
>
ChatGPT已能操控机器人,工程师连代码都不用写,网友:微软在搞天网?

ChatGPT已能操控机器人,工程师连代码都不用写,网友:微软在搞天网?

公众号新闻
Alex 发自 凹非寺
量子位 | 公众号 QbitAI

当我还在跟ChatGPT吹牛尬聊时,有人已经在拿它操控机器人了。

不是别人,正是OpenAI的金主爸爸、不久前刚拿ChatGPT“重新发明搜索引擎”的微软

到目前为止,开发者调教机器人不仅技术门槛高,还道阻且长:

工程师需要在工作流程回路中,不断手写新代码和规范来纠正机器人行为;另外,操控不同的机器人可能需要不同的编程语言和环境。

而在ChatGPT的帮助下,工程师甚至不用手写代码——直接用人话描述想做什么,AI就能自动翻译成机器语言。

这意味着,一方面专业人士与机器人的交互效率起飞;另一方面,技术门槛也降低一大截,外行人甚至也能参与调试,创造出更多使用方法。

举个简单的例子:让无人机自动检查货架。

首先,操作者只需用自然语言给ChatGPT提出要求;然后,AI就能自动翻译成代码,并指挥无人机行动。(还可以规定无人机的飞行路径。)

难怪特斯拉前AI主管Andrej Karpathy会调侃:

最新的热门编程语言是英语。

一个AI指挥多种机器人

实际上,ChatGPT会玩儿的花样可多了。

比如,一位操作者跟AI说:“我渴了,请帮我找个喝的。”

此时AI并不会直愣愣地就去找水了,而是会很机灵地反问:

请问你想喝哪种?这里有好几种饮料,比如椰子水、可乐等等。

当然操作者也不是吃素的,他并未直接告诉AI选哪个,而是说:“我刚从健身房回来,请帮我找个健康点儿的饮料。”

然后更神奇的操作就开始了:

AI先是猜测他想喝椰子水,然后自己噼里啪啦写出一段代码(甚至还有注释)

写完就自己指挥无人机去找椰子水:

除了无人机,ChatGPT还能轻松操控别的小机器人,包括摄像头、机械臂等等。

比如让摄像头在房间里找出能加热午饭的东西。

还有指挥机械臂拼出一个微软的Logo。(悄悄夹带私货)

看到这些,有网友脑洞大开,有人发问:

他们是不是正在建立无所不能的天网?

还有人甚至调侃称,AI可能连发射核弹的指令都会写:

不过话说回来,其实离网友说的这些还差得远,毕竟现在还是需要人类参与的。

怎么实现的?

从前文可以看出,这只灵活的AI不仅与人交流畅通无阻,而且和机器也能快速沟通。

这主要得益于微软团队专门开发的一系列API高级函数库

他们没有让ChatGPT背后的语言大模型(LLM),生成某固定种类的代码;因为机器人是个多元化领域,这样可能会在不同场景下涉及大量微调。

而在新颖的操作框架下,不同机器人,都有自己对应的特定函数库。

——一个AI,就能适应不同的对象、不同的任务

一方面,这些函数库,能够连接到机器人控制系统中管理底层硬件,以及执行基本运动的代码和功能模块。

另一方面,为了让ChatGPT也能遵循函数库的规则,预定义函数命名就很关键。清晰的函数名,能让各API之间建立良好的功能连接,最终生成高质量的回答。

其中一项要求,就是所有API名称必须描述整体功能行为。例如,detect_object(object_name) 函数可以在内部链接到OpenCV函数或计算机视觉模型。

设计好库和API后,微软给ChatGPT编写了一个文本提示(prompt),描述目标任务,并明确说明函数库中哪些函数可用;另外,这还能规定ChatGPT生成代码用哪种编程语言。

值得一提的是,AI生成内容效果,和人为提示的质量呈正相关。为此,微软还开发了一个协作开源平台PromptCraft,任何人都能在此分享不同类机器人的Prompt策略。

到此,幕后部署基本完成,然后用户就能通过“说人话”间接操控机器人了。

如果想要检查AI生成的代码是否有Bug,随时都能在聊天框直接检查,或通过模拟器测试,人类可以用自然语言指导AI进行修正。

另外,还能到等到用户对解决方案满意为止,再在将ChatGPT生成代码部署到机器人上。

最后,如果是你,会想用ChatGPT操控机器人做些什么呢?

论文地址:
https://www.microsoft.com/en-us/research/uploads/prod/2023/02/ChatGPT___Robotics.pdf
参考链接:
[1]https://arstechnica.com/information-technology/2023/02/robots-let-chatgpt-touch-the-real-world-thanks-to-microsoft/
[2]https://www.microsoft.com/en-us/research/group/autonomous-systems-group-robotics/articles/chatgpt-for-robotics/
[3]https://github.com/microsoft/PromptCraft-Robotics#promptcraft-robotics

3月29日「中国AIGC产业峰会」

抢票开启

「中国AIGC产业峰会」定档3月29日,线下会场抢票开启!

百度袁佛玉、智源林咏华、澜舟科技周明、小冰徐元春、科大讯飞高建清、启元世界袁泉、云舶科技梅嵩、特赞王喆、微软关玮雅、源码资本黄云刚、元语智能朱雷、无界Ai马千里、Tiamat青柑、峰瑞资本陈石等来自产学研界大咖嘉宾,还有重磅嘉宾陆续确认中。

扫描下方二维码,报名峰会线下会场啦~


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
重磅 | 我内测了微软最新的 ChatGPT 版必应:比 ChatGPT 更像人,但有一个大隐患我内测了微软最新的 ChatGPT 版必应:比 ChatGPT 更像人,但有一个大隐患终结者最强大脑!谷歌发布史上最大「通才」模型PaLM-E,5620亿参数,看图说话还能操控机器人搜索引擎变天了:微软正式宣布推出首款ChatGPT搜索!How does the Chinese communist party work?阿里版ChatGPT已进入测试!中文聊天截图曝光,达摩院出品AI不但能杀人?!还能操控美国选举?帮助老海归进步央视春晚的元宇宙技术,微软发布AI声音生成工具VALL-E,百度将推出类ChatGPT风格机器人,2023WebRTC预测…ChatGPT 进军 B 端?消息称微软将允许企业创建定制版 ChatGPT微信回应头像褪色,部分C刊不准隐瞒ChatGPT使用,微软推进裁员,Opera新版集成ChatGPT,这就是今天的其它大新闻!苹果「余额宝」 四天吸金 69 亿元;微软拟 10 倍价推私有版 ChatGPT;ChatGPT 「建国」做女王 | 极客早知道这10个春晚小品,经典看不厌!最好看的警匪片《黑雨》重磅!微软发布 ChatGPT 版搜索引擎,用上了比 ChatGPT 更强大的技术Ask me anything…这次要压着谷歌打!ChatGPT已经在Bing提前上岗ChatGPT已过时?Auto-GPT迅速走红,无需人类插手自主解决复杂任务,GitHub标星5万微软再扔AI聊天画图炸弹!视觉模型加持ChatGPT,Visual ChatGPT横空出世科技巨头持续血拼:微软豪掷数亿造ChatGPT超算,谷歌加急测试Big Bard小海龟们最爱吃西餐验证码拦不住机器人了!谷歌AI已能精准识别模糊文字,GPT-4则装瞎求人帮忙ChatGPT成了机器人大脑?机器人的下一个大风口是...马斯克:微软ChatGPT搜索关服!下载量暴增10倍!微软必应集成ChatGPT后需求大爆发;4省份上调最低工资标准;淘宝已屏蔽ChatGPT关键词丨邦早报软体操控机器人,能否挽救被自动化「遗忘」的服装业?ChatGPT 带火“提示工程师”,不用写代码也能年薪数百万?AI不但能杀人?还能操控美国政客?微软发布Visual ChatGPT:视觉模型加持ChatGPT实现丝滑聊天不写代码、靠“玩”ChatGPT年入百万,提示工程师正变成硅谷新宠ChatGPT版Office来了:微软下周四举行发布会,CEO亲自上开始赚钱模式:微软ChatGPT版新必应加广告了ChatGPT讲座:ChatGPT并不神秘,但ChatGPT很神奇通过谷歌面试的ChatGPT要取代码农了?硅谷工程师:先别急马斯克:微软 ChatGPT 搜索关服!集成ChatGPT后必应日活量首破亿!微软推出Azure OpenAI ChatGPT 服务,GPT-4下周发布
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。