这个赛道，是中美竞争点燃新一轮科技革命的火种！

公众号新闻

2023-09-11 23:09

9月7日，腾讯混元大模型正式亮相，标志着我国互联网科技大厂陆续加入“大模型国家队”。

工业革命级别的超级能源“核聚变”永远都差着五十年，工业革命级别的超级材料“室温超导”也遥不可及。

在肉眼可见的未来，“人工智能”将开启人类下一次科技革命成为世界各大国的普遍共识。

人工智能并不是一个新概念，可是过去几十年，人类都没找到“人工智能”像蒸汽机或者“电灯泡”那样赋能所有行业的途径。

一项技术，要达到“引发科技革命”的级别，必须具备赋能各行各业，提升各行各业效率的能力。

直到去年美国Open AI公司发布大语言模型GPT，各大科技公司才明确“人工智能赋能各行各业”的最佳路径。

因此，自主学习大模型，成为中美等大国竞逐下一次科技革命的核心赛道。

美国发布GPT3.5，以及在几个月后发布“更加智能”的GPT4.0，证明美国在大模型领域占有“先发优势”。

不过在美国发布GPT之后，这十个多月的“大模型世界大战”堪称【百模大战】。

虽然美国OPENAI打响了第一枪，但随后除了美国谷歌跟进，这十几个月发布“新模型”的，绝大多数都是中国科技公司。

最近半年，在短视频平台，我们也能看到多家科技公司的“大模型推广广告”，他们基本上都打着“国产GPT”，完美替代的名号。

过去半年多，除了百度，360等互联网大厂都宣布进入大模型赛道，最引人关注的是中国互联网科技的巨头，腾讯和阿里都官宣各自的“大模型战略”。

美国的GPT与中国华为的盘古大模型，腾讯的混元大模型虽然都是在今年集中亮相，但是全球顶尖科技大厂都在更早就开始了大模型的“雏形研究”，像腾讯就从2021年开始先后推出了多个千亿、万亿参数的大模型。

中美开启研发的时间差不多，美国今年的“先发优势”则是过去几年美国“高科技脱钩断链”“先进芯片全面禁售”导致的。

因为中美的大模型竞争，本质上是“底层逻辑，算法，算力”的全方面对决。

最近美国商务部长雷蒙多访华，我们能够更加清醒的看懂美国科技政策。

在我们已经突破或者“不算尖端但依旧有高额利润”的科技领域，美国不希望“脱钩断链”，希望继续“做生意”，甚至要求我国政府给予“更宽松的赚钱环境”。

相反，在我们还在艰难攻关，以及美国明确“未来科技竞争核心领域”，美国的科技封锁与芯片禁售只会“更加残酷与无死角”。

通用大语言模型已经被中美科技界确认为“人工智能赋能各行各业”的最佳路径，那么与大模型相关的“底层框架，逻辑算法，算力”未来一定是美国科技封锁的重中之重。

过去半年多，国内科技企业“百模齐发”，我们却并没有“科技革命”的感觉，主要是两方面原因导致的。

第一个原因，就是过去的大模型“自研率太低”。

过去半年多，个别公司为了“抢进度”，尽快占领市场争夺用户，推出的大模型可以算是“美国开源模型套皮”。

“美国套皮”的优势，就是沿着美国的技术路径，用“同款技术”，可以快速上马“国产”大模型。

可是“套皮”模式的最大风险，就是一旦美国开始“掐脖子”，不仅国内这些平台“瞬间躺尸”，而且前期的巨额投资，前期的用户与数据都成为自己的软肋，只能向美国政府与芯片制造企业妥协“求饶”。

在中美争夺下一场科技革命的核心赛道，最核心的竞争力当然需要掌握在自己手里。

因此从这个月开始，以腾讯混元大模型、华为盘古大模型等为代表的新一代应用，宁愿慢一些，稳一些，也要做到“全链路自研”。

过去大半年，无论中美，宣传学习大模型的时候，重点强调学习时间与效率，以及抓取学习的数据库范围。

可如果用的是美国底层技术框架，美国算力芯片，那么美国按下“封锁按钮”的一刻，这些“亮眼的技术参数”都是浮云。

让人有些惊喜的是，过去大家印象中注重效率与市场，主抓软件与应用的腾讯，这次在大模型战略里，首要强调的却是“全链路自研”。

混元大模型宁愿晚发布半年到一年，也要从底层框架，逻辑算法，网络服务器全部“自主研发，自主生产”，损失了“先声夺人”，但是做到了“自力更生”。

所谓“全链路”，就是从模型算法到机器学习框架，再到AI基础设施全部走“自主路线”。

自主的好处，除了避免美国“掐脖子”，另一个好处是“更懂中国人与中国话”。

过去半年多，无论是美国GPT，还是国内各个大模型应用，都逃不开被“陷阱问题”打脸的窘迫场景。

因此网上一直有现阶段大模型不是人工智能，而是“人工弱智”的调侃。

美国大模型的基础算法与学习框架早已确定，当然不可能为“中文环境量身定做”。

相反，以腾讯为代表的“国产大模型”，因为学习框架自主，就可以针对“中文上下文”，可以将错误率降低30%~50%，也可以针对中文“陷阱问题”与“长篇上下文理解”展开针对性学习演练，这次9月7号的混元大模型现场演练，以及过去两天的“试用”，最鲜明的感受就是“混元不好忽悠了”。

过去半年多，大家经常用各个大模型的“陷阱问答”来玩梗，以至于忽略了“大模型准确性”的重要性。

实际上，大模型的“准确性”，是能否赋能各行各业的“生命线”。

如今市面上的大模型，都只能应用在容错率高，任务简单的休闲领域。

这些休闲领域答错一两个历史问题，或者前言不搭后语，都可以一笑置之，但是在工业领域或者安全领域，那就“谢绝使用”了。

可以想象，一个零件尺寸理解错误，或者材料加工参数不对，有可能造成重大工程装备“性能不足”。

在安全领域，一个“理解错误”，可能是无数人遭遇生命危险。

准确率无法提高，就注定大模型只能用来“玩”，可见适合中国语境的“提高准确率”自主学习模型多么重要。

过去半年多，大模型引发科技界沸腾，但是老百姓却很淡漠的第二个原因，是“落地场景严重不足”。

过去十几个月，从全网因为GPT的更新迭代陷入狂欢，到如今的新模型发布上不了热搜，是因为大家越来越有一个共识：大模型很有趣，很先进，但没啥用！

过去半年多，包括百度在内的科技公司，发布的多款大模型产品，最大的短板，就是没有“应用落地”的端口。

直到这个月，腾讯大模型的发布，大家才直观地感到，原来大模型应用还有这么多落地场景。

过去几年，相信许多人和我一样，已经习惯将微信作为支付，出行，外卖，网购，休闲阅读，游戏的入口。

这样的生活习惯，就让腾讯拥有与生俱来的，连接各行各业消费场景的能力。

比如在前天的发布会上，腾讯展示了腾讯会议、腾讯文档、腾讯广告等多个业务，在接入混元大模型后的实际应用情况。

如果说这次发布会，混元的用途还“偏商务”，那么腾讯游戏、腾讯金融科技、微信搜一搜、QQ浏览器等腾讯旗下50多个业务和产品也已经宣布接入大模型测试。

特别是游戏，微信搜一搜，QQ浏览器都是数亿级别的“用户入口”。

有数亿用户的“端口习惯”，50多个不同应用场景，足够给成百上千的细分产业赋能。

我们能清晰的感觉到，中美大模型赛道的对决，从“百模大战”阶段，进入“三大战役”决战阶段。

在这场决战里，相比较这款大模型的发布，腾讯展现的转型意义更加重大。

腾讯作为科技巨头，过去展现更多的是软件研发能力，与应用快速占据市场的敏锐商业嗅觉。

可是这次腾讯发布的混元大模型，无论是“全链路自研”还是“全场景打通”，展现的都是重资产研发以及追求市场的“长期主义”。

混元大模型的发布，标志着腾讯离开游戏与社交软件的舒适区，用“全链路自研”模式，将自己从轻科技公司，转型成重科技公司。

一个混元大模型，并不能确保我们赢得这场科技对决，但这背后体现的“转型”与“万业互联”，才是中国未来致胜的核心竞争力！

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章