首批国产大模型纷纷上线，但还有些问题没有解答

公众号新闻

2023-09-04 01:09

「这里是当天最值得关注的新闻」

撰文：王杰夫、张司钰

编辑：王杰夫

Key Points

第一批大模型「通过备案」，用户不用排队内测就能体验了；

目前监管机构还没有公布第一批「通过备案」的模型名单，根据公开报道整理有11家，阿里巴巴的通义大模型不在其列；

监管流程中，「备案」和「通过备案」似乎是两回事。

8月31日绝对是这半年来中国人工智能圈最热闹但也最令人迷惑的时刻了。

随着百度第一个踩着零点宣布其「文心一言率先向全社会全面开放」后，智谱、百川智能、商汤等公司或机构都相继宣布其大模型已经「通过备案」。随后，「通过备案」的大模型数量也从媒体最开始统计的5家，随后上升到8家、11家。

日后回头看，8月31日这天一定是中国在生成式AI浪潮中最具标志性意义的一天，然而这项技术究竟面临怎样的监管程序仍然令人困惑。

究竟有几家通过了备案？不清楚。

根据公开报道整理，目前共有以下11家公司的大模型或相关应用获得上市许可：

五家位于北京：分别是百度（文心一言）、抖音（云雀）、百川智能（百川大模型）、智谱（智谱清言）以及中科院（紫东太初）；
三家位于上海：分别是商汤（日日新大模型）、上海人工智能实验室（书生大模型）和Minimax（ABAB大模型）；
两家位于广东：腾讯（混元大模型）、华为（盘古大模型）；
一家位于安徽：科大讯飞（星火大模型）。

究竟多少家、哪些家公司的大模型获批，目前并没有来自监管机构的统一文件。上述11家公司中的部分公司或机构通过社交平台宣布了相关消息，用户也能通过登录其官网与相应的大模型「对话」。

但其中一些公司并没有宣布相关上市新闻，例如很多媒体列出已经通过备案的腾讯（混元大模型），腾讯没有尚未发布这一大模型，用户也不能在其官网通过任何窗口体验。

造成这种局面的一种说法是，监管部门对大模型服务提供商的备案以地域划分，不同地区部门有着不同的进度。

通过备案的是大模型还是基于大模型的应用？也不确定。

除了通过备案的服务提供商名单并不确凿外，这些大模型服务提供商对于通过备案这一事情的表述也有些微妙。目前公开宣布通过备案公司有百度、商汤、百川智能和智谱，它们在公告中都只提及了「基于大模型的应用」开放使用，但对于大模型是否开放却只字不提。

要知道，基于大模型的应用与大模型本身是两个不同的概念，这就像ChatGPT与GPT-4的区别。

基于大模型的应用指的是这几家服务提供商基于大模型技术推出的AI工具，可以通过App或网页的方式呈现。而大模型指的是大语言模型的底层模型，理论上通过《生成式人工智能服务管理暂行办法》（以下简称《暂行办法》）备案的主体应该是大模型。《暂行办法》指出，只要通过了备案，「服务提供商就可以利用大模型提供人工智能服务，包括以API的方式」。

目前所有官宣的服务提供商都只提及此次开放了基于大模型的应用，包括百度的「文心一言」、商汤的「商量SenseChat」，这些都可以理解成类似ChatGPT的个人AI助理。

但哪怕是OpenAI自己都清楚，只拥有面向C端用户的ChatGPT是无法撑起公司估值的，要想发挥出大模型的商业潜力，最好的方式还是通过云服务的方式将大模型的能力开放给B端客户，让每个B端客户都能根据自身需求定制化使用大模型技术。

美国几乎所有云服务公司都在努力将大模型纳入自己的产品库中，本周三Google刚刚为嵌入办公套件Google Workspace的AI助手Duet定价30美元，而OpenAI也在同一天宣布推出企业版ChatGPT，支持企业本地化部署与定制。

但目前所有中国大模型公司的公告都没有提及「通过备案」对于大模型在B端这个最具有商业化潜力的领域有何影响。

从备案到获批的漫漫长路

4月11日，中国互联网信息办公室发布《生成式人工智能服务管理办法（征求意见稿）》，其要求企业在发布生成式AI产品前，需要向国家网信部门申报安全评估，并做算法备案和变更，完成注销备案手续。当时，政策还强调企业应采取措施防止生成虚假信息，这对于生成式AI产品来说，因为受到训练数据偏差、数据缺失，以及模型本身模仿学习、创造性生成等因素的影响，这是一个难以实现的技术难题。
6月20日，中国互联网信息办公室发布了第一批《深度合成服务算法清单》，共有41款算法在列，包括商汤的「商量大语言模型」以及讯飞的「讯飞星火认知大模型」等。
7月15日，国家网信办联合国家发改委、教育部、科技部等七部门发布《生成式人工智能服务管理暂行办法》，自8月15日施行，提出要采取更精细化监管举措，比如采取有效措施提高训练数据质量等。