抄作业可以，但请体面

公众号新闻

2023-11-17 00:11

保留原名、或加个声明，就是一份难得的体面。

文｜于丽丽

编辑｜刘旌

来源｜暗涌Waves（ID：waves36kr）

封面来源｜IC photo

11月14日，原阿里首席AI科学家贾扬清的一条朋友圈截图四处流传。贾扬清说，他的一个朋友告诉他，某国产大模型不过是LLaMA架构，只是更换了几个变量名而已。

很快有好事者发现，在大模型、数据集开源社区Hugging Face上，就有一位开发者发出了类似质疑：“该模型使用了Meta LLaMA 的架构，只修改个tensor（张量）”。LLaMA是Facebook母公司meta旗下开源免费商用的开源大模型。

贾扬清的朋友圈之所以流传，很大程度是因为其戳破了AI圈一个人人皆知的秘密：所谓的自研大模型，其实“水分”很大。

一位投资人曾对暗涌Waves说：两个月就上线一个大模型，“想想就不对不是嘛”。早在今年五月的Waves大会上，中国人民大学高瓴人工智能学院卢志武教授就指出，所谓“国产大模型的春天”，不过是很多公司在“微调国外底座模型”的假象。

尽管从现实来看，微调似乎是不得而为之的。原因可以很宏观：openAI如此凶狠，除非你能超越它，否则做半天，很可能也不值钱，甚至不如开源。原因也可以很具体：这是一个没有两三亿美金几乎上不了牌桌的游戏，让一个初创公司从头训练大模型几乎是痴心妄想。

昨天的讨论中，青年AI学者符尧也在一个群中表达了自己的理解，他认为“如果因为架构不变而批评一个模型没有创新，这样的批评对任何一个模型都是不公正的”，因为所有的模型都是在前者的基础上接力完成的，“每个模型架构基本都大同小异，但效果完全不同”。

有投资人表示，在Hugging Face 上，架构一样但名字不同的模型的确很多，因为大部分改动的是训练方法以及数据配比。

贾扬清在后来的声明中也进一步解释道：他批评的并不是模型架构不改变，而是生生改了个名字。改名会带来的麻烦是，原来适配LLaMad的代码可以用，而现在则要做大量工作来适配新名字。

这起风波或许偶然，但也呈现出了在追赶OpenAI过程中，速度的紧张与边界的模糊。

对于中国的AI创业者——尤其是应用型创业者来说，作为新一代AI技术的追随者，他们正在进入的是一种前所未有的难以与OpenAI区分“你我”的模糊地带。

前几天召开的OpenAI开发者大会是一次最新的导火索。去年底，ChatGPT3.5横空出世后，中国的AI创业者有过几波集中的人头攒动。最早，无论是大厂还是创业公司，都有一种大模型执念。但GPT4的快速发布以及大厂进击后，除了Minimax和智谱AI，因为“起跑早，已经有相对成熟的大模型产品出来”，以及极少数其他公司，多数人快速放弃了大模型路线。

当时还存在、且大放光彩的王慧文创立的光年之外，以及王小川的百川智能，也很快选择了大模型和基于模型应用两条线并进。

但被称为“AI界春晚”的OpenAI开发者大会，预示了一大批初创公司的必然徒劳。这场大会不仅有会前流传的GPT-4 Turbo和更强大的全新功能，还将推出GPT store,以及自定义GPT(GPTs)，而用户也可以创建自己的GPT。

这意味着，在中国创业者最擅长的应用这个赛道上，也极可能寸草不生：如果你没有快速掌握垂直的场景、数据，可能随时被吞噬。

这就是这一代AI追随者的窘境：新一代AI应用型产品定义，必然要结合大模型的能力边界，而关隘是，大模型的能力始终在快速演化，OpenAI始终在演化。

前端的变动不居，后段的应用就如同是沙滩上的高塔。

今年5月，某知名初代产品经理还信心十足地表示，Chatgpt3.5发布之后，中国的产品经理早已在行动。而这次OpenAI发布者大会之后，面对“AI创业者的机会还剩多少”的提问，他也只回复了一个哭笑不得的表情包。

过去在互联网和移动互联网时代的传递链条上，从copy to China到copy from China，中国的创始人凭借的是庞大的市场和用户群，孕育出的庞大产品经理，整个过程可谓是行云流水，异常丝滑。而在新的AI时代，这种珠联璧合显然已经被打断。新一代的产品经理，不仅仅需要产品能力，还要充分理解大模型以及数据。

当然还有一条众所周知的变量在于：与技术与产品边界定义权一起失效的外部环境。

那么在当下，一个中国AI创业者、尤其是应用类公司，该怎样找到解法？

一个乐观者会告诉你，大模型一定分地域的，所以中国的大模型与OpenAI并不一定有直接竞争。

其次，那些基于AI的原生应用、社区以及掌握垂直场景、数据的公司，也会存在回旋的余地与大口呼吸的空隙。事实上，很多应用层创业者，也都来自教育、医疗、游戏等垂直领域。AI的进展也在进一步引燃自动驾驶、电动汽车、机器人等领域。

很多人提到“数据壁垒”之说：一种是垂直行业非公开数据积累，而ChatGPT主要是泛行业的公开数据；一种是用户私有数据的积累，“了解越多，就越懂你”。

这个逻辑大概率是成立的。因为在未来的垂直场景、数据的争夺战中，必然会迎来掌握崭新技术的AI创业者与手握数据和客户资源的传统企业服务公司、垂直领域龙头公司的一场厮杀。

让我们回到问题的最初。一位AI投资人曾向我们提出一个问题：“在OpenAI这个前所未有的新物种面前，谁又不是抄作业的那一个？”从模仿到创新，是大部分后发地区的必然路径，甚至这也是多数人生的路径。

其实更务实地说，问题应该是：怎样才是更有道德的“抄作业”？

在瞬息万变的创新生态里，往往都是迅猛且边界混乱的，过度“苛求规范”，某种意义的确会影响效率甚至扼杀创新。但即便如此，也应存在底线。

就像在最早那条朋友圈的最后，贾扬清发出的具体请求：各位大佬，如果你们就是开源的模型结构，求高抬贵手就叫原来的名字吧，免得我们还要做一堆工作就为了适配你们改名字……

保留原来的名字、或者多加个声明，就是这个时代里一份难得的体面。