GPT-4V多模态能力惊人!公式截图直出代码,「龙与魔法世界」瞬间生成,OpenAI总裁激动转发
新智元报道
新智元报道
【新智元导读】GPT-4在默默更新了多个功能之后,早已有了惊艳世人的各种新能力,简直是上体入地无所不能!
最近,GPT-4一直在默默更新,加入了多模态,语音交互等功能。
但是与年初OpenAI每次发布的新功能,都能引得外界一阵惊呼的阵仗相比,现在GPT-4的声量似乎小了很多。
不知道是不是担心自己产品发布太过于耀眼,导致监管和官司不断找上门,OpenAI除了3周前更新了文生图模型DALL-E 3外,在发布了GPT-4之后的7个月内,官方没有公开发布任何新的产品和功能。
但是OpenAI总裁Greg Brockman自己却在X(推特)上,不断转发利用新版的GPT-4来实现的各种天马行空的功能。
利用GPT-4V的多模态能力和代码能力,直接把一个写在书上的数学公式转化成一段Python代码。
而利用GPT-4刚更新不久的语音功能,有人开始把它当成商务谈判的教练来进行模拟练习了。
就在这个帖子下面,这位帝国理工学院商学院的学习设计师留言称,他们已经开始使用GPT-4的语音功能为MBA设计培训课程了。
直接用ChatGPT集成的的DALLE 3来为游戏设计师生成世界观和原画设定图。
只要几行Prompt,一个飞龙世界的文字描述和原画风格图就出来了。
直接用DALLE 3来生成自己想要的GIF文件。
一颗玉米如何成为爆米花。
一只跳舞的狗子。
我们就一起来看看如何利用GPT-4来完成这一系列的功能。
GPT-4理综版
当然,因为模型还是存在出现幻觉的可能,所有的结果不能直接拿过来就用,还是要认真检查其中的错漏。
比如截图中第六行的代码,「d_hat(i, j)」应该是「d_hat(i)」。
虽然有小错误,但是网友们依然对这个功能给与了非常高的评价。
这位MIT博士,AI初创公司的创始人认为,如果没有额外的上下文,GPT-4无法识别这个函数,但它确实知道它正在做什么……非常酷。
另一位开发了一个金融AI工具的开发人员称,这个用例非常棒!有无穷的想象空间。
并且他给出了两个具体的用例。
可以截图研究论文中的复杂数学方程并在本地快速运行。
几句Prompt 生成龙与魔法的世界
另外一位网友分享了它通过ChatGPT创造了一个和龙有关的奇幻世界的过程。
微信扫码关注该文公众号作者