首批国产大模型纷纷上线,但还有些问题没有解答
「这里是当天最值得关注的新闻」
撰文:王杰夫、张司钰
编辑:王杰夫
Key Points
第一批大模型「通过备案」,用户不用排队内测就能体验了;
目前监管机构还没有公布第一批「通过备案」的模型名单,根据公开报道整理有11家,阿里巴巴的通义大模型不在其列;
监管流程中,「备案」和「通过备案」似乎是两回事。
8月31日绝对是这半年来中国人工智能圈最热闹但也最令人迷惑的时刻了。
究竟有几家通过了备案?不清楚。
五家位于北京:分别是百度(文心一言)、抖音(云雀)、百川智能(百川大模型)、智谱(智谱清言)以及中科院(紫东太初);
三家位于上海:分别是商汤(日日新大模型)、上海人工智能实验室(书生大模型)和Minimax(ABAB大模型);
两家位于广东:腾讯(混元大模型)、华为(盘古大模型);
一家位于安徽:科大讯飞(星火大模型)。
究竟多少家、哪些家公司的大模型获批,目前并没有来自监管机构的统一文件。上述11家公司中的部分公司或机构通过社交平台宣布了相关消息,用户也能通过登录其官网与相应的大模型「对话」。
但其中一些公司并没有宣布相关上市新闻,例如很多媒体列出已经通过备案的腾讯(混元大模型),腾讯没有尚未发布这一大模型,用户也不能在其官网通过任何窗口体验。
造成这种局面的一种说法是,监管部门对大模型服务提供商的备案以地域划分,不同地区部门有着不同的进度。
通过备案的是大模型还是基于大模型的应用?也不确定。
除了通过备案的服务提供商名单并不确凿外,这些大模型服务提供商对于通过备案这一事情的表述也有些微妙。目前公开宣布通过备案公司有百度、商汤、百川智能和智谱,它们在公告中都只提及了「基于大模型的应用」开放使用,但对于大模型是否开放却只字不提。
要知道,基于大模型的应用与大模型本身是两个不同的概念,这就像ChatGPT与GPT-4的区别。
基于大模型的应用指的是这几家服务提供商基于大模型技术推出的AI工具,可以通过App或网页的方式呈现。而大模型指的是大语言模型的底层模型,理论上通过《生成式人工智能服务管理暂行办法》(以下简称《暂行办法》)备案的主体应该是大模型。《暂行办法》指出,只要通过了备案,「服务提供商就可以利用大模型提供人工智能服务,包括以API的方式」。
目前所有官宣的服务提供商都只提及此次开放了基于大模型的应用,包括百度的「文心一言」、商汤的「商量SenseChat」,这些都可以理解成类似ChatGPT的个人AI助理。
但哪怕是OpenAI自己都清楚,只拥有面向C端用户的ChatGPT是无法撑起公司估值的,要想发挥出大模型的商业潜力,最好的方式还是通过云服务的方式将大模型的能力开放给B端客户,让每个B端客户都能根据自身需求定制化使用大模型技术。
美国几乎所有云服务公司都在努力将大模型纳入自己的产品库中,本周三Google刚刚为嵌入办公套件Google Workspace的AI助手Duet定价30美元,而OpenAI也在同一天宣布推出企业版ChatGPT,支持企业本地化部署与定制。
但目前所有中国大模型公司的公告都没有提及「通过备案」对于大模型在B端这个最具有商业化潜力的领域有何影响。
从备案到获批的漫漫长路
4月11日,中国互联网信息办公室发布《生成式人工智能服务管理办法(征求意见稿)》,其要求企业在发布生成式AI产品前,需要向国家网信部门申报安全评估,并做算法备案和变更,完成注销备案手续。当时,政策还强调企业应采取措施防止生成虚假信息,这对于生成式AI产品来说,因为受到训练数据偏差、数据缺失,以及模型本身模仿学习、创造性生成等因素的影响,这是一个难以实现的技术难题。
6月20日,中国互联网信息办公室发布了第一批《深度合成服务算法清单》,共有41款算法在列,包括商汤的「商量大语言模型」以及讯飞的「讯飞星火认知大模型」等。
7月15日,国家网信办联合国家发改委、教育部、科技部等七部门发布《生成式人工智能服务管理暂行办法》,自8月15日施行,提出要采取更精细化监管举措,比如采取有效措施提高训练数据质量等。
9月1日,国家互联网信息办公室关于发布第二批《深度合成服务算法备案清单》,包括百度的文心大模型、WPS AI、腾讯混元大模型、华为盘古大模型等在内的110个生成式AI相关算法在列。其中没有出现阿里巴巴的通义大模型。
通过备案有什么影响?
理论上,实施算法备案制而非审核许可制,一定程度上有助于AI产业的创新发展。但8月31日的一系列上市新闻又表明,「备案」和「通过备案」似乎是两回事。监管的这种不确定性可能在接下来一段时间持续存在。
不过,《生成式人工智能服务管理暂行办法》8月15日开始实施,仅仅两周后,就有至少11家公司的大模型「获批」。这个速度也意味着中国在生成式AI领域的商业化进度在加快。
通过备案后,大部分普通用户将可以没有门槛地感受大模型的能力,而不必像之前一样排队等内测名额。拥有大模型的公司和应用也将获得更多用户量,用户的使用数据有助于推动模型的进一步迭代。
直面终端用户后,生成式AI的成败将不只限于公司具备的大模型研发能力,产品设计、运营能力等因素也将成为重点。
-END-
我们是一个诞生于GPT浪潮、由《第一财经》YiMagazine孵化的全新内容IP。
和每一位关心技术、关注人类命运的读者一样,我们希望在这个充满不确定性的时代,更好地理解快速变化的科技世界,也更好地理解生而为「高级智能」的我们自己。
在这个目标下,我们计划从学术、商业、伦理、监管等多个角度报道和讨论与「智能」相关的议题。请注意,我们说的智能,不只是 AI。
以下是最近发生的其他智能资讯
与记者交流,可添加微信(请备注公司名称和姓名):
王杰夫 微信号: wjfsty
张司钰 微信号: helianthus351
吴洋洋 微信号: qitianjiuye
微信扫码关注该文公众号作者