Redian新闻
>
抄作业可以,但请体面

抄作业可以,但请体面

公众号新闻

保留原名、或加个声明,就是一份难得的体面。


于丽丽

编辑刘旌

来源暗涌Waves(ID:waves36kr)

封面来源IC photo

11月14日,原阿里首席AI科学家贾扬清的一条朋友圈截图四处流传。贾扬清说,他的一个朋友告诉他,某国产大模型不过是LLaMA架构,只是更换了几个变量名而已。

很快有好事者发现,在大模型、数据集开源社区Hugging Face上,就有一位开发者发出了类似质疑:“该模型使用了Meta LLaMA 的架构,只修改个tensor(张量)”。LLaMA是Facebook母公司meta旗下开源免费商用的开源大模型。

贾扬清的朋友圈之所以流传,很大程度是因为其戳破了AI圈一个人人皆知的秘密:所谓的自研大模型,其实“水分”很大。

一位投资人曾对暗涌Waves说:两个月就上线一个大模型,“想想就不对不是嘛”。早在今年五月的Waves大会上,中国人民大学高瓴人工智能学院卢志武教授就指出,所谓“国产大模型的春天”,不过是很多公司在“微调国外底座模型”的假象。

尽管从现实来看,微调似乎是不得而为之的。原因可以很宏观:openAI如此凶狠,除非你能超越它,否则做半天,很可能也不值钱,甚至不如开源。原因也可以很具体:这是一个没有两三亿美金几乎上不了牌桌的游戏,让一个初创公司从头训练大模型几乎是痴心妄想。

昨天的讨论中,青年AI学者符尧也在一个群中表达了自己的理解,他认为“如果因为架构不变而批评一个模型没有创新,这样的批评对任何一个模型都是不公正的”,因为所有的模型都是在前者的基础上接力完成的,“每个模型架构基本都大同小异,但效果完全不同”。

有投资人表示,在Hugging Face 上,架构一样但名字不同的模型的确很多,因为大部分改动的是训练方法以及数据配比。

贾扬清在后来的声明中也进一步解释道:他批评的并不是模型架构不改变,而是生生改了个名字。改名会带来的麻烦是,原来适配LLaMad的代码可以用,而现在则要做大量工作来适配新名字。

这起风波或许偶然,但也呈现出了在追赶OpenAI过程中,速度的紧张与边界的模糊。

对于中国的AI创业者——尤其是应用型创业者来说,作为新一代AI技术的追随者,他们正在进入的是一种前所未有的难以与OpenAI区分“你我”的模糊地带。

前几天召开的OpenAI开发者大会是一次最新的导火索。去年底,ChatGPT3.5横空出世后,中国的AI创业者有过几波集中的人头攒动。最早,无论是大厂还是创业公司,都有一种大模型执念。但GPT4的快速发布以及大厂进击后,除了Minimax和智谱AI,因为“起跑早,已经有相对成熟的大模型产品出来”,以及极少数其他公司,多数人快速放弃了大模型路线。

当时还存在、且大放光彩的王慧文创立的光年之外,以及王小川的百川智能,也很快选择了大模型和基于模型应用两条线并进。

但被称为“AI界春晚”的OpenAI开发者大会,预示了一大批初创公司的必然徒劳。这场大会不仅有会前流传的GPT-4 Turbo和更强大的全新功能,还将推出GPT store,以及自定义GPT(GPTs),而用户也可以创建自己的GPT。

这意味着,在中国创业者最擅长的应用这个赛道上,也极可能寸草不生:如果你没有快速掌握垂直的场景、数据,可能随时被吞噬。

这就是这一代AI追随者的窘境:新一代AI应用型产品定义,必然要结合大模型的能力边界,而关隘是,大模型的能力始终在快速演化,OpenAI始终在演化。

前端的变动不居,后段的应用就如同是沙滩上的高塔。

今年5月,某知名初代产品经理还信心十足地表示,Chatgpt3.5发布之后,中国的产品经理早已在行动。而这次OpenAI发布者大会之后,面对“AI创业者的机会还剩多少”的提问,他也只回复了一个哭笑不得的表情包。

过去在互联网和移动互联网时代的传递链条上,从copy to China到copy from China,中国的创始人凭借的是庞大的市场和用户群,孕育出的庞大产品经理,整个过程可谓是行云流水,异常丝滑。而在新的AI时代, 这种珠联璧合显然已经被打断。新一代的产品经理,不仅仅需要产品能力,还要充分理解大模型以及数据。

当然还有一条众所周知的变量在于:与技术与产品边界定义权一起失效的外部环境。

那么在当下,一个中国AI创业者、尤其是应用类公司,该怎样找到解法?

一个乐观者会告诉你,大模型一定分地域的,所以中国的大模型与OpenAI并不一定有直接竞争。

其次,那些基于AI的原生应用、社区以及掌握垂直场景、数据的公司,也会存在回旋的余地与大口呼吸的空隙。事实上,很多应用层创业者,也都来自教育、医疗、游戏等垂直领域。AI的进展也在进一步引燃自动驾驶、电动汽车、机器人等领域。

很多人提到“数据壁垒”之说:一种是垂直行业非公开数据积累,而ChatGPT主要是泛行业的公开数据;一种是用户私有数据的积累,“了解越多,就越懂你”。

这个逻辑大概率是成立的。因为在未来的垂直场景、数据的争夺战中,必然会迎来掌握崭新技术的AI创业者与手握数据和客户资源的传统企业服务公司、垂直领域龙头公司的一场厮杀。

让我们回到问题的最初。一位AI投资人曾向我们提出一个问题:“在OpenAI这个前所未有的新物种面前,谁又不是抄作业的那一个?”从模仿到创新,是大部分后发地区的必然路径,甚至这也是多数人生的路径。

其实更务实地说,问题应该是:怎样才是更有道德的“抄作业”?

在瞬息万变的创新生态里,往往都是迅猛且边界混乱的,过度“苛求规范”,某种意义的确会影响效率甚至扼杀创新。但即便如此,也应存在底线。

就像在最早那条朋友圈的最后,贾扬清发出的具体请求:各位大佬,如果你们就是开源的模型结构,求高抬贵手就叫原来的名字吧,免得我们还要做一堆工作就为了适配你们改名字……

保留原来的名字、或者多加个声明,就是这个时代里一份难得的体面。

36氪旗下投资报道公众号

👇🏻 真诚推荐你关注 👇🏻

来个“分享、点赞、在看”👇

抄作业可以,但请体面

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
抄作业 | 嘀嗒出行上市招股书中关于数据合规相关风险的论述毛岸英 伟大的气魄趣图:摇一摇广告的正确用法,大厂​来抄作业来了!Amazon 黑五正式开抢!神马值得买这里抄作业!最近给妹妹反复读的书,备考剑桥英语的来抄作业一个月瘦了5斤,全因早餐吃得对!快进来抄作业团|高颜值新春战服!日常穿也合适,直接抄作业!团|直接整套抄作业!这个秋天的穿搭狠狠拿捏了抄作业 | 宝钢集团数据治理规划(2022-2025)人到中年,可以不奢华,但不能不体面素士:电动牙刷「抄作业」没有未来假期出游怎么拍大片?进来抄作业!抄作业 |《某中心信息系统运维安全管理规定》Nature|ChatGPT让学生课堂表现大涨,教授怒斥:我用可以,你们用就是作弊!读大学还能改变命运吗?德国人说可以,但他们毕业太难了士嘉堡中餐霸气拒绝网红博主免单要求!老板“我英文不够好,但请互相善待”天各一方 (2)瞬間的永恆凶猛的犬儿研究了3w+真实案例总结出这份高质量「脱单秘籍」,快来抄作业!抄作业 | 菜鸟上市招股书中关于数据合规相关风险的论述直接抄作业!带娃徒步8年,吃穿用行攻略,想到想不到的都在这了!离开 OpenAI,Sam Altman:很怀念,但请期待「大招」离婚5年,37岁女星再度美上热搜!她的穿搭思路,简单又抬气质,普通妈妈也能抄作业“你过来呀!”Amazon黑五购物车抄作业:乐高、气炸锅、扫地机器人!最近给叮当准备的书,小学生来抄作业现在有什么副业可以让人快速上岸? 可以试试这个行业,上岸其实不难!!出道时被骂“最丑港姐”,近照惊为天人!她的逆袭美容法,普通妈妈也能抄作业!单身久了才懂的生活智慧,每一条都值得抄作业——抄作业!温哥华市长喊话学习“榜样”本拿比,这几个天车站要建高层!周边屋主坐等拆迁暴富!咀外文嚼汉字(286)翻译和通译抄作业 | 苹果APP隐私新政简介与分析寒假亲子旅游指南,八条线路给你整理好了!亲子研学,小众景点,家长闭眼抄作业!加国中餐馆霸气拒绝网红博主免单要求!老板“我英文不够好,但请互相善待”变态语文老师开团|越玩越上头,有这些玩具打底,以后陪写作业可太省心了!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。