Redian新闻
>
GPT-4o手写板书以假乱真惊呆网友!杀死谷歌翻译,代码建模无所不能

GPT-4o手写板书以假乱真惊呆网友!杀死谷歌翻译,代码建模无所不能

公众号新闻



  新智元报道  

编辑:乔杨 庸庸
【新智元导读】GPT-4o到底有多强?只有用过才能知道。这两天,网友们不仅探索出了很多全新ChatGPT的炫酷用法,也逐渐开始意识到,这标志这OpenAI将逐渐替代谷歌曾经的地位,全面接管AGI时代。

GPT-4o到底有多强?只有用过才能知道。这两天,网友们不仅探索出了很多全新ChatGPT的炫酷用法,也逐渐开始意识到,这标志这OpenAI将逐渐替代谷歌曾经的地位,全面接管AGI时代。

随着越来越多人开始试用GPT-4o,大家发现发布会上的demo真的只是冰山一角,官方后续发出的用例以及网友们的整活才是更精彩的部分。

生成手写体文字

OpenAI联创Greg Brockman今天po出一张GPT-4o生成的图片,他兴奋地宣布:

「仅用GPT-4o的图像生成功能就可以探索很多东西。团队正在努力将这些内容推向世界」

可以看到,这张图片中,黑板上的手写体达到了以假乱真的程度!

网友表示,看到这张图片的一瞬间还以为是Greg讲座现场的板书呢。

不知道笔迹专家看到了会作何感想,是否能读解出这面黑板上「机器书写」背后的人格特征呢?

看来GPT-4o不仅能模仿人类的语音语调,连字体也开始向人类手写体接近了。

1分钟从屏幕截图生成视频游戏

推特网友从网上找了一张Breakout游戏的截图,丢给ChatGPT并问它「你能把这个用Python编码出来吗?」

一分钟之后,ChatGPT就生成了一份没有bug、可以直接执行的Python文件,完全复刻了截图的效果。

而且Breakout这个游戏也是大有来头,是一款1976年雅达利公司发行的街机视频游戏,Steve Jobs和Steve Wozniak曾经参与设计和开发工作。

用文字提示进行3D建模

前几天,有人曾经放出用GPT-4o将平面图片进行3D重建的之后的效果,已经十分惊艳。

但没想到,GPT-4o生成3D效果甚至都不需要给它平面图片,一段文字提示就够了,比如下面这个用户让ChatGPT创建一个STL文件,建模一个有四条腿的桌子,并添加一些随机特征。

ChatGPT不仅能给你渲染出的3D效果图,还能马上出一份原始的STL文件,就不用自己费力从头开始建模了。

这一版ChatGPT的更新就是瞄准了个人AI助手的方向,工作狂Sam Altman最近在接受采访时,也分享了自己使用ChatGPT提高工作效率的方法。

他说,在电脑上工作时,想搜索一些东西就不得不在页面之间不断切换。有了ChatGPT在旁边,就可以「随叫随到」直接问它,让自己能始终保持在专注的状态。

GPT-4o vs. 谷歌翻译

OpenAI的发布会展示了GPT-4o的实时翻译能力,实现了英语和意大利语之间的无缝转换,几乎没有响应延迟,让网友再次惊呼「翻译要失业了」,这次连同声传译行业也要一锅端了。

与此同时,也掀起了一场和谷歌翻译之间的较量。

有网友表示「谷歌和三星在手机上开发过类似的功能,但是做得很烂。你必须要说得很慢,而且确保吐字清晰,不然识别出的文本就会一团糟,也得不到正确的翻译。」

谷歌翻译到了要和大家说再见的时候了吗?随着OpenAI的语言能力不断扩展,这并非完全没有可能。

GPT-4o使用了新的分词器,不仅英语的效率更高(token减少了1.1倍),而且还提高了许多其他语言的使用效率。

Greg Brockman发文称「我们还显著提高了非英语语言的性能,包括改进分词器以更好地压缩其中的许多语言」。

OpenAI现在支持50多种语言,从Greg Brockman放出的图片中可以看出,包括阿拉伯语、俄语、印地语在内的多种语言的token数量都得到了压缩。

但是,OpenAI的翻译功能也并非无懈可击,有很多网友质疑发布会上ChatGPT生成的意大利语听起来有点奇怪。

于是有意大利用户在线答疑,「其实这不是一种口音,只不过是AI语音在单词之间插入了间隙。说英语时还好,但在意大利语中,这听起来非常奇怪和呆板,因为它扰乱了节奏。」

更要命的是,GPT-4o分词器语料库中,中文数据污染非常严重。

有老哥写了个脚本筛选ChatGPT新词表中最长的100个中文字符,结果发现里面大部分赌博网站广告,剩下一小部分是色情网站广告。

面对这种景象,网友不禁感叹「为什么GPT-4o如此horny?」

既然这样,还是多用GPT-4o「练习练习英语」吧。

「后浏览器世界」:ChatGPT后再无谷歌搜索

OpenAI同时发布了两项成果:GPT-4o及其新的ChatGPT桌面应用程序。有专家预测,虽然 GPT-4o因其多模态而大放异彩,赚足了眼球,但桌面应用程序才有可能真正挑战谷歌主导地位,改变当今互联网的形态。

GPT-4o的主要特点是多模态和低成本的低延迟,实现了人机之间更自然的对话和交互,而且与GPT-4Turbo相比似乎有了模型能力和智能的增长。

但当我们回顾几年后的2024年5月13日时,最重要的消息可能是ChatGPT桌面应用程序。

ChatGPT桌面应用程序将先对MacOS适用,随后推出Windows版本,目前官网已发布了移动端iOS和安卓系统的下载链接。

该应用程序可以快速访问ChatGPT,并且你可以选择让它「透视」你的屏幕,实现「看你所看」,还可以像使用ChatGPT一样,和它实时语音交互。

这完全超出了传统浏览器的功能想象,从浏览器进入桌面,OpenAI迈出的这一小步,有可能是人机交互方式向前发展的一大步,OpenAI希望的,是完成一场「搜索革命」。

OpenAI希望摆脱浏览器并进入桌面

浏览器是旧的互联网,万维网的世界是谷歌的主场。

但OpenAI对这种旧的方式say no,它带来是一种使用计算机和网络的新方式——一个可以为用户完成一切的助手,用户需要什么,只需大声说出来。

Sam Altman在他关于GPT-4o的博客文章中明确表示「对我来说,与计算机对话从来没有感觉很自然,但现在情况发生了改变。随着我们增加(可选的)个性化功能、访问你的信息、协助你采取行动,我真的看到了一个令人兴奋的未来,我们能够利用计算机做比以往更多的事情。」

ChatGPT桌面应用程序可以获取访问麦克风、摄像头、文件、登录信息以及用户屏幕的权限,是「个人助手」的最佳位置。

有了这个「助手」,即使是智能手机用户,也很难被谷歌和网络所吸引。

在这种与计算机交互的新方式中,万维网几乎没有立足之地。充其量,它充当的是信息的提供者。

事实上,OpenAI将自己定位为聊天机器人生态系统的看门人,它推出了「出版商优选计划」,正在把选定的媒体机构发展成为合作伙伴,美联社、Axel Springer、金融时报、世界报等媒体已加入该计划。

如果OpenAI 成功(目前还无法确定),那么它对我们信息生态系统的市场影响力将远远超过今天的谷歌。

参考资料:

https://x.com/gdb/status/1790869434174746805

https://analyticsindiamag.com/openai-just-killed-google-translate-with-gpt-4o/

https://the-decoder.com/openais-most-important-message-isnt-gpt-4o-its-the-post-browser-world/

https://x.com/rowancheung/status/1790783202639978593

https://x.com/tianle_cai/status/1790109646205890723

https://x.com/sherwinwu/status/1790854473260388814

https://x.com/op7418/status/1790292330156863964

https://www.reddit.com/r/singularity/comments/1cse5j7/major_issue_discovered_in_gpt4o_the_new_optimized/

https://the-decoder.com/openai-thinks-it-knows-what-media-is-high-quality-and-thats-a-problem/


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
Copilot功能大礼包!微软让个人AI助手进入团队,GPT-4o现已助力Azure,浏览器视频实时翻译特斯拉擎天柱进厂打工,精准分装电池惊呆网友!马斯克预告22自由度灵巧手GPT-4o成为全领域SOTA!基准测试远超Gemini和Claude,多模态功能远超GPT-4470B模型秒出1000token,代码重写超越GPT-4o,来自OpenAI投资的代码神器Cursor团队我们上手实测GPT-4o:速度快到飞起,还能直出板书,但视频分析逊色用GPT-4纠错GPT-4!OpenAI推出CriticGPT模型;谷歌Gemma 2发布,与第一代相比性能更高丨AIGC日报Apple WWDC24的18条总结:从GPT-4o开始集成ChatGPT查尔斯揭幕新肖像吓呆网友!仿佛地狱撒旦全身鲜血,英王室流年不利像中邪?!GPT-4o团队引发OpenAI组织创新热议!应届生领衔Sora,本科生带队GPT-1,经验职级都是浮云OpenAI一夜干翻语音助手!GPT-4o模型强到恐怖,ChatGPT学会看屏幕,现实版Her来了实测最新AI语音模型:让特朗普、丁真说绕口令堪称以假乱真,但断句整得稀碎6GPT雷军成“歌手”摇人榜第一,本人回应惊呆网友!加州牧师“花4万买凶”谋杀女儿男友!杀手连开多枪,失手了……谷歌翻译宣布新增110种语言:覆盖全球8%人口128亿片酬引热议!韩星金秀贤倒插门成赘婿!无所不能的外星人“都教授”人设崩了!宋仲基力挺发声...AI换脸以假乱真!蚂蚁数科发布反DeepFake产品,还设百万奖金池邀请黑客找bug【视频】波音747客机在美着陆失败 “上下弹跳”惊呆网友ChatGPT 之父最新专访:发现 GPT-4o 惊喜用途,下一代模型可能不是 GPT-5微软发布新AI PC全家桶,支持GPT-4o/苹果发布更新修复照片复现问题/ChatGPT 语音酷似「寡姐」,本人回应超ChatGPT-4o,国产大模型竟然更懂翻译,8款大模型深度测评|AI 横评河南夫妇捡回的巴基斯坦女婴长大了,一开口惊呆网友!以中国国籍自豪,努力买房报答父母……速度秒杀GPT-4o!Mistral开源首个22B代码模型破记录,支持80+编程语言桌面版ChatGPT登台演讲,能视频通话还会实时读屏,GPT-4o最新demo再次惊艳:“能力还是被低估了”《是否还和过去一样》&《我等的是你》速度秒掉GPT-4o、22B击败Llama 3 70B,Mistral AI开放首个代码模型清华系细胞大模型登Nature子刊!能对人类2万基因同时建模,代码已开源OpenAI爆炸更新:GPT-4免费了!新模型GPT-4o发布,视觉、语音能力大幅增强,速度起飞,API打骨折3OpenAI掌门人最新专访:GPT-4o让我爱不释手 下代大模型可能不叫GPT-5刚入职2年,年薪$15万!澳学徒tradie薪资惊呆网友:入错行了5GPT-4o成全球网友新玩具,秒秒钟纸质原型转录初始HTML,网友:谷歌你是一点流量摊不上啊惊掉下巴:GPT-4o现场爆改代码看图导航!OpenAI曝光LLM路线图,GPT Next年底发
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。