一文看清当前运营商AI大模型布局:TeleChat、鸿湖与452亿押注算力
作者:詹士
物联网智库 整理发布
导读
AI有多火?运营商们也纷纷开足马力做了。
就在近日,中国电信公布了类ChatGPT产品—— “TeleChat”大模型。联通也在上周MWC期间,官宣了旗下的“鸿湖”大模型。
中国移动也有动作。同样是上周,移动宣布——正建设面向通用智能的“人工智能大平台”,该平台定位为新型人工智能基础设施。
AI大模型,并非今年才诞生的新鲜概念。但因ChatGPT以惊人速度传播,大模型概念也因此在2023年破圈。
多数人看来,投身AI大模型研发的厂商或是OpenAI、DeepMind等专业团队,亦或是Google Brain、Meta旗下FAIR等大厂部门,在国内,明星玩家也主要是百度、阿里、腾讯、讯飞、商汤等企业。
那么,运营商们做大模型,水平如何?在该领域国内外厂商又有什么其他动作?今天就来盘一盘。
TeleChat、鸿湖与算力竞赛
先来看看运营商们的大模型产品及相关布局。
(1)中国电信TeleChat大模型
关于电信此次发布的大模型,TeleChat,据公开资料,该模型支持输出代码、写演讲稿等,其公司研发目标是成为“百亿级AI服务商”,产品涵盖AI算法、平台、应用、硬件、大模型等。
尽管参数量及更多技术细节暂时没有公布,但能看出,该模型并非多模态LLM,有别于OpenAI旗下的GPT-4及百度文心一言,后面两者可生成文字、代码、图片、音频等内容。
据行业媒体CWW信息,中国电信可能使用华为的鲲鹏920芯片或海光 HYGON Dhyana 系列处理器进行相关产品的部署训练,中国电信在2020年采购了一批此类硬件,用于“培育自主可控产业链”,实现“云计算服务”。
值得一提的是电信TeleChat的官宣机构为——中国电信股份有限公司数字智能科技分公司。该企业于2023年5月刚成立,曾用名为:中国电信股份有限公司企业信息化事业部。
公开报道显示,该公司设立目的,在于三方面:
(1)争做核心技术自主掌控的科技型企业;
(2)加快推动公司大数据和AI核心能力建设;
(3)进一步强化公司科技创新能力。
对于未来规划,该公司称,将打造万级AI算法舱,强化大数据和AI关键核心技术攻关,依托自有算法及设备打造多场景、多应用、可复制的标准产品和平台,持续提升大数据和AI研发创新和运营能力。
6月公开的一份招聘海报显示,中国电信数字智能科技分公司还在招聘大模型算法工程师,包括图像、语义两个方向。实习生招聘还包括多模态、强化学习方向,工作地点为北京东城区。
中国电信对GPT的规划,之前已经透露出一些信息。
据IT时报内容,今年5月一次活动中,中国电信科技委主任、首席科学家韦乐平对外表示:
“(电信)企业可能需要在基础大模型GPT框架上开发一个规模没有那么大、成本可控、专业性更强、更有利于AI广泛网络应用的大模型,即‘电信专业GPT’。”
TeleChat为代表的NLP模型之外,中国电信在今年4月末发布了“星河”通用视觉大模型2.0。
据称,该大模型“星河”大模型数据量从百万提升至亿级,模型参数从10亿提升至百亿。
该参数量距离人们熟知的千亿模型规模尚有距离,不过中国电信称,他们融入图像、视频、语义多源信息,提升模型语义理解能力,并扩展视觉多元感知、精细分割和空间交互关系能力。在对外宣传中,他们称,该模型在超百项业务中算法平均提升10%以上。
在更底层的算力等数字基础设施布局方面。中国电信集团大数据和AI中心AI研发中心副总经理李永翔,在今年6月对外表示:
中国电信正依托天翼云进行人工智能4级算力的平台建设:在全国6个大区建设核心的、大型的算力集群,承载全国大数据规模AI训练和大规模云端数据推理场景。
李永翔还补充道,电信目前已适配了十余款国产AI芯片,并自研了端云结合的渲染引擎和统一跨平台AI推理框架。
(2)中国联通“鸿湖”大模型
联通旗下大模型名为“鸿湖”,号称首个面向运营商增值业务的大模型。
目前,它拥有8亿训练参数和20亿训练参数两个版本,最大参数数量级与15亿的GPT-2几乎同等量级。
值得一提的是,“鸿湖”大模型属于多模态大模型,官方宣称,它可以实现以文生图、视频剪辑、以图生图等功能。
单个模型之外,前几日的MWCSH上,中国联通还对外表示,要构建多行业多场景的大模型,推动AI为千行百业创造更大价值。
图源:中国联通
案例之一是在5月,上海联通携手华山医院、上海超算中心等单位发布“Uni-talk”医疗算网大模型。该大模型是一款为医疗行业定制的大模型产品,功能类似ChatGPT,不过更加聚焦于医疗领域的应用。华山医院会将“Uni-talk”应用于专业医学文献检索,辅助诊断等场景。
算力服务方面,中国联通同样重视,其2022年算力网相关投资为124亿元,同比增长65%昭示了联通在算力方面的决心。
在MWC期间,该公司表示:欲构建大算力的平台底座......充分满足人工智能对“通用算力+智能算力+超算算力”的异构混合算力需求,打造面向大模型的统一AI研发平台,全面提供大模型训练推理的服务能力。
具体到项目,联通落地算力项目不少。
据人民邮电报报道,中国联通5月在广东韶关,部署了国家级算力中心,率先建成融合通算、超算、智算的综合型算力中心。
6月8日,广东联通智算中心正式揭牌,相关负责人对其价值进行介绍:“未来,面对各行各业大模型的训练,通过超级计算对数据先进行预处理和清洗,再把预处理之后的数据送至智算中心进行AI计算,将是一种更高效、更经济的方式”。
近期中国联通还对外表示,公司在算力上形成“5+4+31+X”的云网边一体化多层级布局, 即9个枢纽节点、31个省级核心数据中心和X个地市级区域及边缘数据中心。
值得一提的是,联通还有个名叫CubeAI智立方的开源算能服务平台,据称,它由中国联通研究院自主研发,集AI模型自动化服务封装、发布、共享、部署和能力开放等功能于一体。
在对外合作方面,联通与科大讯飞成立了人工智能反诈联合实验室,此外,还成立了中国联通昇腾人工智能创新实验室。在MWCSH现场,联通工作人员也表示,公司目前也在同科大讯飞商讨大语言模型方面的更多合作可能。
(3)中国移动押注算力
不同于前面两家,移动暂时还未发布旗下大模型。
其打法在于——站在幕后,大模型提供基础设施服务。此种思路,更像是不发大模型,但服务了MiniMax、智谱AI、百川智能、澜舟科技等团队的字节火山引擎。
近期,移动在大模型领域的最大动作,莫过于官宣了建设中的“人工智能大平台”。
公开资料显示,该平台定位为新型人工智能基础设施,承载面向国民经济主体的通用智能大模型、行业大模型等,基于泛在的算网基础设施,实现数据的高质量利用。
事实上,移动在两年前就提出了“以网强算”,发展算力网络的理念。
2022年,移动在算力方面投资金额达335亿元,2023年预计达到452亿,同比增加35%。
在近日举办的“算力网络技术与产业大会”上,中国移动副总经理高同庆对外表示,移动将在算力方面形成七大成果。
这当中就包括:以新型智算为重点打造算力高峰,正在构建E级超大规模单体智算中心,支撑AI大模型训练和孵化;
更早之前,移动还发布了“九天”人工智能平台。该平台由是中国移动自主研发的人工智能创新平台,提供从基础设施到核心能力的开放AI服务。
在号称AI春晚的2023智源大会上,中国移动副总经理高同庆提及:
以“九天”人工智能平台为核心实现新型智算引擎,针对大模型开放服务需求。
高同庆补充道,“九天”平台支持多样化智能算力、深度学习框架,基于跨域异构算力的高效调度、千卡并行的高性能模型训练加速以及云边协同的一体化训推等新型智算技术,能够提供全面的大模型训推一体化研发能力和新型MaaS能力。
“九天”平台背后研发团队,是移动在AI领域的重要研发机构,中国移动研究院旗下,人工智能与智慧运营中心。
根据官网介绍,人工智能与智慧运营中心由研究院首席科学家冯俊兰博士领衔,是中国移动研究院围绕中国移动 “5G+AICDE”融合创新和融智发展目标而设立的专门从事AI领域技术创新和产品研发运营的部门,是中国移动在AI方向的核心研发团队。
(4)中国广电也有探讨
中国广电在大模型领域近期动作不算多,值得一提的是今年4月,中国广电召开大模型人工智能技术与应用专题研讨会。
当中提及,加快打造智慧广电“算网大脑”,建设融合业务平台,更好实现“有线+5G”全业务运营。
不止国内运营商,国外发力大模型的运营商亦不在少数。
身为巨头运营商之一,Verizon Communications Inc (Verizon)在近期一次采访中就透露,他们在生成测试用例及代码迁移方面使用了生成式AI技术。
此外,Verizon Business首席产品官也曾告诉行业媒体Light Reading,该运营商正在使用专门的人工智能来改进网络性能、跟踪数据趋势和客户体验,并探索生成式人工智能的潜在用途。
不过值得一提的是,Verizon此前也禁止内部员工使用ChatGPT,原因在于——防止公司机密泄露。
美国通信巨头AT&T并未推出大模型,却也在运用大模型技术,毫不意外地,其合作方是OpenAI。
据介绍,AT&T部署了OpenAI的工具,帮助其技术人员完成写代码、客户支持、多种语言翻译等任务。其中一个系统名为Ask AT&T,能通过自然语言沟通方式,帮助员工找到各类公司文档及数据,并且还能帮助公司优化网络、升级老旧代码。
AT&T首席数据官对此表示,几乎不需要增加任何工作,生产率平均提高了 25% 到 50%。
今年早些时候,AT&T与英伟达官宣合作,前者将使用NVIDIA 的AI处理数据,组织员工培训、增强客户体验,甚至是规划公司用车行驶路线。
有趣的是,AT&T本身与人工智能颇有渊源。其曾经旗下的贝尔实验室,走出不少人工智能先驱,其中就包括名声横跨通信及AI两界的香农,以及三巨头之一的LeCun......
另一家跨国公司Amdocs,业务为通信与媒体服务,也最新推出了电信生成式AI框架,amAIz。
该公司表示,amAIz能将运营商级架构与开源技术、大语言模型(LLM)相结合,为通信公司创造一个平台,发挥AI价值。
根据其官网介绍,Amdocs合作方为OpenAI。更早之前,Amdocs还官宣与微软扩大伙伴关系,联合创建AI支持的客户互动平台。
也有运营商直接自己训练AI大模型。来自韩国的运营商KT,就使用了NVIDIA DGX SuperPOD平台和NeMo框架,训练出一个参数量为十亿参数的大型语言模型。
该模型名为GiGA Genie智能对话者,可被集成进智能音响中,同样基于Transformer,它可以对话并操控电视、更新路况信息,目前已经与800人进行过对话。
写在最后
在过去几年,AI及大模型已经解决了不少通信领域的问题与挑战,但这轮LLM爆发下,让人们获取了更多信心。
谷歌云上月发表了一篇博客,探讨生成式AI对通信服务商的转型影响。
当中认为,三个领域的影响最为突出:
(1)改善客服效率,帮助选择套餐,提供客户个性化体验;
(2)将网络规划和日常运行与AI连接起来,为自主网络铺平道路;
(3)简化通信运营效率,提升故障问题诊断效率及服务满意率。
表面看,各家运营商只是发发大模型,更多细节也尚未披露,但追本溯源,大模型本身并非关键所在,实际上这是技术对既有流程、模式、认知的一次革新——
大模型对通信行业的重塑,早已发生,还在继续。
微信扫码关注该文公众号作者