Twitter上的大家自然已经是马不停蹄的搞起事情来了。比如通过提供给ChatGPT的数据直接创建一个 XGBoost 预测模型,并且可以优化迭代,你所需要做的仅仅是告诉ChatGPT去进行调整参数的行动即可。这是对Code Interpreter 代码执行能力的一个很好的体现。再比如 Ethan Mollick就让 Code Interpreter 用 Python复制了自己的Stata格式文件,并且以CSV格式输出。这个过程中 Ethan Mollick所做的就是上传文件,用英语告诉它该干什么(out put it as a CSV file.),剩下的事情“升级版”ChatGPT完全自己完成了。这种代码级的理解甚至还涉及到一些跨模态领域,比如ChatGPT可以进行一些基础视频剪辑,还能把GIF和静态图片变成通过放大缩小、转移视角等方法变成一个短视频。在Ethan Mollick给的另一个例子中,他上传了关于美国海岸灯塔位置的CSV文件,并要求ChatGPT生成它们在地图上的所有位置并闪烁,ChatGPT成功做到了这一点。注意,这是一张GIF图片!而目前为止(这个功能才上线了两天时间)最让人惊讶的是,有人甚至用 Code Interpreter 制作一个游戏!Twitter用户@icreatelife写了一行要求ChatGPT生成游戏代码的 prompt,然后一套完整的游戏代码就出现了。具体的步骤是这样的。第一步,写prompt:write p5.js code for Asteroids where you control a spaceship with the mouse and shoot asteroids with the left click of the mouse. If your spaceship collides with an asteroid, you lose. If you shoot down all asteroids, you win! I want to use my own textures for the spaceship and for asteroids.翻译:编写 p5.js 代码,在小行星中用鼠标控制一艘宇宙飞船,然后用鼠标左键单击小行星来射击小行星。如果你的宇宙飞船与小行星相撞,你就输了。如果你击落了所有小行星 ,你赢了!我想用我自己的纹理来制作宇宙飞船和小行星。第二步,去创建草图,然后从 GPT-4 复制粘贴代码。第三步,生成纹理文件。第四步,将文件名替换为自己的文件名。最后,运行程序!这个开发的简单程度几乎等同于经典的“把大象装进冰箱总共分几步”,实际上如果不是要使用自己的纹理样式,这个游戏的开发过程就只剩下输入prompt,然后复制代码,替换文件名并运行这样寥寥几步!尤其特别值得一提的是,如果程序运行中出现了错误,@icreatelife 强调你可以要求ChatGPT去修复,方法就是把错误代码复制粘贴到对话框中——这和询问人类程序员的方法是一模一样的。而在某些例子里,Code Interpreter甚至可以自己修复代码!
更有想象力的未来
能够做到这一切神奇功能,还得回归到Code Interpreter的原理——相比于功能,Code Interpreter的原理看上去简单得多。当用户发起请求的时候,Code Interpreter会生成一个沙盒环境来执行命令,这个环境里包括了一个Python解释器、库和临时的磁盘空间,在执行完成后,Code Interpreter会直接输出结果,这些结果在基于ChatGPT界面的所有函数中都可以使用,于是复杂任务就能被很好拆解。作为最早使用Code Interpreter 功能的人之一,Ethan Mollick对它的能力进行了一个小概括:Heading towards a world of coding by intent. 迈向意图编码的世界。你想要做什么,Code Interpreter用代码帮你实现。这也就意味着,编程的成本变得无限低,人人可以用自然语言来自由编程。甚至,如果你没有任何编程基础,还可以让ChatGPT来教你!你只需要给它的prompt里说“现在假设你是一位编程老师”即可,上文设计游戏的@icreatelife 就是这么做的。用户用自然语言告诉ChatGPT最终需要的结果,Code Interpreter 在运行代码的过程中如果遇到错误会自己进行修正,直到产生符合要求的答案。就生产力方面而言,这当然意味着对程序员工作的大减负,因为写代码实际上已经自动化了。加上对文件内容本身的理解以及对数据、图标的分析能力,Code Interpreter 将对程序员、数据分析师等许多行业造成大冲击,这也是有人愿意称它为GPT4.5的原因——它实在是太强大了,人们对它的能力认知可能还需要有一个逐步提高的过程。但另一个方面,除了对就业市场的潜在影响,更为重要的是——拥有了代码能力的ChatGPT,实际上可以借助Code Interpreter找到降低和消除机器幻觉的路径。自然语言在描述世界的过程中可能出现种种不准确、谬误和自圆其说的地方在代码面前都不存在,因为代码本身是基于精确规则运行的,这其中绝少有似是而非的空间。因此借助Code Interpreter 来消除大模型的“胡言乱语”这个思路将变得十分有吸引力。如果代码让大模型变得更精准,那某种意义上说也就是让大模型更诚实了,从这个意义上说,把Code Interpreter称之为GPT4.5也不为过了。