Redian新闻
>
无耻!!!阿里前副总裁贾扬清揭发--李开复公司的开源大模型,套壳Meta的LLaMA却故意不说。。。

无耻!!!阿里前副总裁贾扬清揭发--李开复公司的开源大模型,套壳Meta的LLaMA却故意不说。。。

科技

本文首发微信公众号:飞总聊IT

大语言模型这两年受到热捧,国内也有很多创业公司。李开复也创立了大语言模型创业公司“零一万物”。


零一万物最近发布了开源模型Yi-34B,这个模型在Hugging Face上收到了很多关注。


阿里巴巴的前副总裁贾扬清在创业,他的公司要适配各种大语言模型。他最近指出,有客户找他的公司去适配一家国内的公司的新模型,贾扬清自己的公司太忙了,还没来得及适配。


结果最近有朋友告诉他,这家公司用的是LLaMA的架构,但是为了表示自己的不一样,就把代码里面的名字给改了,然后换了几个变量的名字。


贾扬清表示,有海外工程师直接指出了这一点,还有人在HuggingFace上放了一个把名字改回去的checkpoint,说现在大家可以直接用LLaMA的代码来加载了。


贾扬清表示自己是小公司,得罪不起大佬,所以不敢直接把名字说出来,但是大佬如果用的就是开源的模型架构,那么就还是用原来开源模型的名字吧,免得小公司还要做一堆额外的工作就是为了适配改了名字以后的开源模型。



贾扬清不敢得罪的这个大佬就是李开复。有国外的开发者在Y Combinator网站上发帖指出,李开复旗下的零一万物的开源模型Yi-34B采用的就是LLaMA的架构,只是重命名了两个张量。


这种明明用了对方开源架构却故意改名字的事情,就很恶心了。有人指出,如果零一万物完全使用了Meta的结构,代码库和相关资源,也就必须遵守LLaMA许可协议。不然的话,它们的开源项目就是有问题的。


李开复成立的大模型公司“零一万物”已经完成了一轮融资,由阿里云领头,目前估值10亿美元,是名副其实的独角兽。


零一万物很快就回复了贾扬清的指责。回复中表示:


GPT 是一个业内公认的成熟架构,Llama 在 GPT 上做了总结。零一万物研发大模型的结构设计基于 GPT 成熟结构,借鉴了行业顶尖水平的公开成果,由于大模型技术发展还在非常初期,与行业主流保持一致的结构,更有利于整体的适配与未来的迭代。同时零一万物团队对模型和训练的理解做了大量工作,也在持续探索模型结构层面本质上的突破。


这个回复,很多人并不买账,觉得零一万物模糊了很多东西,就是不肯承认自己套壳了。


在Hugging Face上,零一万物的团队成员Richar Lin回应承认了更改张量名称一事,表示在实验的时候,对代码进行了多次重命名,但是发表模型前忘记改回来了,他同时表示会将张量改回原LLaMA的命名。


至于实际上改名是不是因为做实验改了名字又在发表之前忘记改回来了,这个事情,我只能呵呵了。


一家独角兽公司,由名人李开复创立,居然被另外一个AI名人贾扬清指出套壳了Meta开源的LLaMA,然后又不遵循开源协议,改了改变量名,就说是自己的开源项目。这事情看起挺恶劣的。


而零一万物的回复又不痛不痒的,不愿意承认自己的错误。我本人一直对李开复很尊重,但是李开复旗下零一万物的表现,让我失望了。而李开复本人在事情中到底扮演了什么角色,我们不知道,但是事情发生以后,他个人的态度,也让我觉得,很多东西,盛名之下其实难副。


有句话总结的好:努力,不要脸,努力不要脸。。。

我建了个星球,聚焦讨论职场发展和裁员应对的问题,有兴趣的朋友可以加入,向我提问,和我一起讨论这方面的问题。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
重构 LLaMA、更改张量名,李开复公司回应来了!网友:这就是中国大模型研发现状?李开复旗下340亿参数开源大模型被指“套壳LLaMA”,最新回应来了!李开复零一万物发布首款大模型;马斯克xAI发布首个大模型;360、美团、昆仑万维等最新消息;vivo发布蓝心AI大模型低调发育 8 个月后,李开复和他的大模型团队首次亮相UC伯克利团队开源MemGPT大模型上下文内存管理方案;AgentLM、多模态Fuyu-8B、数学LLEMMA等专用大模型开源直追GPT-4!李开复Yi-34B新成绩公布:94.08%的胜率超越LLaMA2等主流大模型千元成本搞定专业大模型,系统优化+开源大模型是关键 | 潞晨卞正达@MEET2024我,一个95后,从阿里辞职与贾扬清去硅谷创业20B跨级挑战70B性能!国产开源大模型打造大模型新标杆OpenAI开启“GPT Store”时刻;李开复官宣「全球最强」开源大模型;阿里百度华为三星等最新消息打通大模型训练任督二脉!国内首个千亿参数、全面开源大模型来了,还联手开发者共训李开复官宣「全球最强」开源大模型:一次处理40万汉字、中英均霸榜必须站队站哪队?北京理工大学发布双语轻量级语言模型,明德大模型—MindLLM,看小模型如何比肩大模型李开复4个多月后“放大招”:对标OpenAI、谷歌,发布“全球最强”开源大模型李开复说话算数:零一万物大模型首次发布,AI 2.0 正在路上苹果正开发自研高性能电池 / OpenAI 推出自定义版 ChatGPT / 李开复 AI 公司首发大模型阿里巴巴智能信息事业群发布夸克大模型;李开复AI公司回应“抄袭”;贾乃亮双11总销售额超13.6亿……李开复4个多月后“放大招”:对标 OpenAI、谷歌,发布“全球最强”开源大模型变态语文老师李开复发布零一万物首款340亿参数大模型Yi;摩尔线程设立AISG和MCSG战略部门丨AIGC日报心平气和聊聊李开复的零一大模型套壳LLaMA这件事2023华源科技协会年会盛大举行 陆奇、吴军、金智洁、Bill Jia、贾扬清....重磅嘉宾云集 700+注册人员参会小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大贾扬清创业新动作:推出AIGC提示工具,几个字提示玩转SDXL,细节拉满估值超10亿美元,阿里巴巴参与投资李开复新公司原阿里P11大牛贾扬清吐槽某国产大厂AI大模型抄袭,感慨小公司不想得罪大佬毛岸英 伟大的气魄OpenAI探索将ChatGPT引入课堂;李开复回应大模型架构争议|AIGC周观察第二十五期李开复被大模型绊了一跤阿里云中标9亿AI算力大单;浙大校友开源LLaVA-1.5多模态大模型;Meta因开源模型遭抗议丨AIGC大事日报最强开源大模型刚刚易主!李开复率队问鼎全球多项榜单,40万文本处理破纪录清华系大模型新秀获20亿投资;AI教父加入初创公司;套壳ChatGPT不是长久之计;百图生科拿下10亿美元大模型订单天各一方 (2)瞬間的永恆咀外文嚼汉字(286)翻译和通译
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。