62岁李开复,又有了新身份公众号新闻2024-05-15 04:05这是人类有史以来最重要的技术,不能错过这次革命。作者丨赵晓晓编辑丨关雎图源丨零一万物5 月 13 日,上午 10:00,李开复准时出现在鼎好大厦的A座20层,一身藏蓝色西服套装,浅色衬衫配领带,三七分的发型,跟去年 3 月份的一场分享会上穿着几乎一致,唯一区别是脸上多了一副眼镜。这是零一万物成立一年后,李开复首次在媒体面前公开露面,他回答了关于新品和零一万物的一切,并首次对去年涉及Llama架构的争议做出回应。零一万物去年7月上线,11月发布了首个模型Yi-34B,半年后的今天又发布了新的千亿参数闭源模型 Yi-Large 和首个国内to C产品 “万知 AI”,李开复还亲自出任万知的CEO。在斯坦福的开源评测项目 AlpacaEval 2.0 上,Yi-Large 英语能力主要指标 LC Win Rate(控制回复的长度) 排位世界第二,仅比 OpenAI 今年 4 月发布的新版 GPT-4 Turbo略输一点,胜率(Win Rate)则排到了第一。在中文能力上,SuperCLUE 更新的四月基准表现中,Yi-Large 位列国产大模型之首。斯坦福AlpacaEval 2.0 Verified认证模型类别,英语能力评测:零一万物的Yi-Large Preview 的 LC Win Rate为51.9%,排第二,Win Rate为57.5%,排第一。去年零一万物陆续上线的 4 个海外产品中,有一个生产力产品的 ROI (投资回报率)已经实现了 1,这就表示增长还可以更激进。海外产品的收入主要来自C端用户付费,“今年会有1-2亿元收入、近千万用户。” 李开复说。这是一场既要速度又要技术的较量。今天的AI环境与上一次四小龙时代完全不同,它能带来真实的价值,大模型的临界点是AI普惠点,谁先点燃这个点,它会成为一个行业里的巨头。有人把李开复称为“最年长的” 中国大模型创业者,他今年已经 62 岁,零一万物也成为中国六家大模型独角兽之一。40 年前,李开复在博士论文申请信里写到,“AGI就是我的梦想。”“我这次创业,十年都不会套现。”李开复说。做AGI 时代的微软去年 3 月的分享会上,李开复把AI 2.0定义为“绝对不能错过的一次革命。”它的巨大跃迁之处是克服了AI 1.0单领域、多模型、没有实现商业化的限制,能带来真实的价值。“比如生产力的 AI 应用,过去从来没有一刻可以做到别人帮我写报告、写文章和做 PPT,也从来没有一个软件,可以帮我分析总结一千页、甚至一万页的文字。”李开复说。2022 年底,ChatGPT出现后对市场进行了最快速度的教育。GPT4发布后,成为大模型领域的“一个金标准”,同时还点燃了 to B 跟 to C 的机会。一家公司如果抓住了一次技术浪潮,它会成为一个行业里的巨头,如果两次技术浪潮都能抓住,它就会成为一个世界性的卓越公司。“所以我们要自己下场做。”李开复说。李开复1983 年开始在卡耐基梅隆大学攻读计算机博士,对人工智能领域已经有近 40 年的研究。过去十几年,他一直是创业者背后的支持者,这次走向台前,是因为他相信这是人类有史以来最重要的技术,不能错过这次革命。零一万物的起点是海外,to B。去年 9 月,零一万物在海外上线了4 款产品,其中有一个生产力产品的 ROI(投资回报率)已经实现了 1。这意味着,零一万物从用户手中收到的订阅费,已经低于获取用户成本加 GPU 的成本,摆脱了“烧钱获客。”李开复和团队有一个标准,一般至少要看到ROI达到 0.6 才会开始推,否则用户越多越亏钱。如果产品推到了 1,就表示增长还可以更激进。4款海外产品里,娱乐、陪伴类的ROI 还在较低的阶段,生产力产品已经给零一万物带来了一个亿的收入,有近千万的用户。去年11 月发布的开源模型Yi-34B,在权威榜单中超越了Meta AI研发并开源的 Llama2-70B、阿联酋的技术创新研究所开发的Falcon-180B等大几倍的模型,成为当时世界范围内开源最强基础模型之一。发布会开始的前夕,零一万物的团队连夜在 Hugging Face、魔搭社区等海外社区上线了六个 API ——Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark ,“一早起来就看到Reddit上的讨论非常火热。”目前,零一万物的海外产品模型选型是Yi-Large 加 GPT-4 的组合,“最开始推出的时候我们的自研模型还没有做好,Yi-Large在海外上线后,会成为我们实时对比测试自研模型的平台。”零一万物生产力产品负责人曹大鹏说。“现在我们完全有底气把已经达到PMF(Product Market Fit,产品与市场互相匹配)的产品,再推回中国。”李开复说。海外的AI生态已经非常繁荣,很多AI原生应用已经诞生,甚至达到了数千万美金的收入,也有很多的成熟产品和公司用OpenAI的 API做出了自己的第二曲线新业务。相比之下,国内会慢一点,还在探索阶段。零一万物暂时不做国内的to B业务,不接项目制的订单,是因为李开复觉得国内还没有逃离上次 AI 1.0 的魔咒——一些很优秀创业公司,陷入了一个高成长但低质量的恶性循环里。to C相对好做一些,万知是零一万物的第一款C端产品,精准切入了“找、读、写” 职场人的三大需求,也是业内第一款具有“AI-First”理念、将模型能力与应用场景完美融合的to C应用产品。“所有的应用都应该是AI-First、AI-Native,没有AI就不成立。”李开复说,“比如PPT 制作功能,在国内外就很少看到。”Google前CEO艾瑞克·史密斯对此给予的肯定是,“信息包装是500亿美金的市场”。零一万物会做很多事,海外、国内,to B、to C,它Day One 就是一个全球化的是公司。公司已经启动下一代 Yi-XLarge MoE 模型训练,冲击 GPT-5 的性能与创新性。“我们的理念就是要做AGI 时代的微软。”李开复说。每个公司都要找到自己的TC-PMF任何时候,创业者都要学会在相对充分的资源里,寻求成本和效率的最优解。李开复定义了一个新的词汇:TC-PMF——在寻找产品与市场匹配点的基础上,加上了技术(technology)和成本(cost),这是一个四维的匹配。强调技术和成本,是因为李开复认为,PMF已经不能完整地定义大模型的创业了,因为要考虑到模型现在的技术能力、之后的发展情况和推测成本。“现在的AI 和移动互联网有一个很大差别,就是移动互联网没有推理成本。”李开复说。比如某些应用需要 AI 不能有幻觉,那么现在的技术就有挑战;有些应用需要大尺寸的模型或者长文本窗口,但这可能带来 50 秒的推理延迟,如果处理一百万token ,就要花 75 块钱。在移动互联网时代,PMF曾是众多初创企业追求的核心目标,用户规模增长所带来的边际成本很低。但在大模型时代,模型训练和推理成本都很贵,是每一个创业公司都会面临的增长陷阱,很多公司会因此胡乱烧钱,走向破产。“所以每个公司都要找到自己的 TC-PMF。”李开复说。他把TC-PMF即将在一个应用领域出现的那个点叫AI普惠点,只有达到这个点,技术、模型和成本之间才能达到最完美的匹配状态。而在这个点来临之前,企业要先把产品做出来,等待时机,成为一个Popular App。抖音成为Super app的时间点有两个,第一个点是4G的普及,第二个点是安卓千元机的普及,两个点的先后到来,一下子把短视频市场扩大了100倍。最快找到的方式是自己做推理引擎,这需要很强的模型团队、AI Infra(基础层)团队和应用团队,三个团队成为一体,互相配合。这是一件听起来简单,但做起来很难的事情,也是企业自建推理引擎遇到的最大挑战。零一万物团队是国内极少数能吸引到谷歌、微软在内的高水平算法人才的公司,除了团队之间配合默契外,他们尤其重视 AI Infra的优化工作:从选择服务器到设计机房和部署 GPU,再到建向量数据库,都是自己来,自己掌握降低推理成本的节奏。“好处是,别人的推理成本降低十倍时,我们可能降二十、三十倍。”李开复说。多方面优化GPU 成本后,其训练千亿参数的 Yi-Larege 模型时,同比下降了一倍左右;接入自研向量数据库后,成本比用第三方向量数据库下降至18%。海外 TC-PMF 已经进入ROI为正的阶段。必须自己找 TC-PMF,还因为李开复相信,“没有一种技术可以吃一辈子,一定要找到技术之外的壁垒。”他举例,移动互联网时代,为什么安卓、苹果、微信这么强,抖音还能杀出来?就是因为字节跳动很早就预测到了用 AI 来推荐短视频,找到了自己的PMF,把握住时间窗口,打造了非常高的用户粘性和成长率。当它成为一个有海量用户的普惠应用,微信就再也没办法复制抖音、把它杀死了。大模型推理成本的下降会推动中国AI大模型进入“落地为王”的阶段,李开复判断,今年会迎来“大模型应用爆发元年”,明年下半年,将迎来大模型普惠应用的井喷期。“做AGI 是我的梦想”李开复现在有四个身份:创新工场创始人、投资人、零一万物创始人、万知CEO(Chief Experience Officer首席体验官)。2009 年,李开复在北京中关村成立了创新工场,开辟了中国风险投资和创业的新模式,至今他已经做了 15年的投资人。在AI 1.0时代,创新工场投了第四范式等10多家AI独角兽企业。去年李开复 61 岁,他选择成为一名创业者,这个年纪已经是大多数人的退休年纪,只因为他看到了人类有史以来最重要的技术,才决定“再努力一把。”这也是李开复40多年前写进博士申请信里的梦想,希望未来有机会能在AGI领域做一些事。过去几十年,他一直在研究AI可能会对人类产生的影响,并先后出版了三本相关书籍,多数人对他“儒雅”的印象也都源于他“作家”的身份。他还建议年轻人多了解AI,别只关注“AI会不会取代我们的工作。”成为万知CEO是因为他没给自己设其他选项,“从一开始我就考虑自己做CEO,”李开复说,对于首款to C产品,他觉得前期还需要倾注更多心血去发现问题并及时修善。从万知上线到现在,他每天都会测上一百条以上的问题。最有价值的修改建议是搜索框的加长,这是他在谷歌时遇到的问题,用户在搜索框输入两三个字搜不出来东西,输入十个字结果就变好了,最后解决方案是做了一个更长的搜索框。据零一万物 API 平台负责人蓝雨川透露,零一万物今年在C端收入会在1-2 亿元,微软的Office每年有几十亿美金的收入。“生产力产品市场的天花板非常高,我们也在思考如何把人工智能工作空间做得更大。”蓝雨川说,作为结果,零一万物可以扩展海外市场,比如去中东、东南亚。过去一年,李开复成为非常有热度的人物,一多半是因为零一万物在短时间内上线,又在短时间内推出了多款新品,并在天使轮就成为独角兽。另一小半是因为陷入Llama架构的争议。“套壳的说法纯属子虚乌有,当时有很多技术专家写过详细文章解释了。”李开复说,中国大模型的架构都是基于Transformer或 Llama 的架构,技术圈对 Llama 架构这个称呼本来就不同意。“对于大模型来说,权重更高的是训练本身以及通过训练获得的参数和代码。零一万物 Yi 模型是从零开始训练,自己获得的参数和代码,没有参考任何 Llama 或其他模型的参数。” 李开复说。今天的AI已经是个充分竞争的市场,比拼的不止是技术、团队,还有心态。对于AI,李开复是有点偏执在的,他专注于把产品做好,其他的事情交给市场去验证。他最近还开了抖音号,但不是为了直播带货,是为了分享好的技术和产品。站在投资人身份的角度,李开复说如果他手里有很多钱,会全部投给零一万物。这次创业,李开复的期望是“冲一下万亿美元”,AGI是一个很大很大的梦想,不能只是为了赚点钱。他也承诺投资人,十年不会套现。微信扫码关注该文公众号作者戳这里提交新闻线索和高质量文章给我们。来源: qq点击查看作者最近其他文章