一家创业公司“赶考”大模型140天:争吵、奔跑、新内卷
文|《中国企业家》记者 孔月昕
编辑|马吉英
头图来源|受访者
傍晚7:30左右,Sobot智齿科技的员工还坐在工位的电脑前,盯着屏幕认真敲击键盘,完全没有下班的意思。
今年以来新增了AIGC研发及相关业务后,专项小组的几位员工每天都要抢占会议室开会、讨论,有时候预约不到会议室,几个人就围坐在工位里讨论,聊着聊着突然激烈地“争吵”起来。
“不知道的以为我们这是菜市场。”智齿科技联合创始人、CTO吴立楠开玩笑道。
去年年底,ChatGPT刚问世时,智齿科技从创始人到普通员工,都收到了公司内部、投资人、媒体人,以及各种微信群的“轰炸式”信息。
彼时,智齿科技的投资方之一真格基金组织了一场视频会议线上分享,从扫盲的角度分享了ChatGPT和大模型背后的底层原理演进过程等。“这应该是我听过的最好的一次相关分享,当时线上至少有几百人。”
听完这场分享后,联合创始人、CEO徐懿和吴立楠等人都觉得这件事“并不简单”。2013年8月,徐懿与吴立楠、彭伟、龙中武四人联合创立智齿科技,并担任CEO。他曾任锐捷网络企业服务软件GSN产品经理,吴立楠此前在神州数码研发核心岗位任职。
智齿科技的业务领域集中在SaaS行业,主要提供一体化客户联络解决方案,涵盖“服务、营销、私域、BPO外包”四大业务板块。自2014年至今,智齿科技共完成七轮、超13亿元人民币的融资,投资机构包括软银愿景基金2期、高瓴创投、用友、云启资本、IDG资本、真格基金等。
在徐懿看来,ChatGPT的相关应用可以用到公司产品的各个场景中,这对于他们来说是莫大的机会。于是,正在外地出差的徐懿和吴立楠立即拉了微信群,将压力给到了研发、市场等部门。
在6月中旬接受《中国企业家》采访时,吴立楠介绍,智齿科技是国内客户联络领域第一家完成产业与AIGC结合的公司。“我们并没有研发大模型,而是将目前市场上领先的AIGC应用与现有客服产品结合起来。融合后,当用户在线做咨询时,会优先启用智齿科技知识库,在知识库无法作答的情况下再启动AIGC资料库,这种双库模式保证了输出答案的准确度。同时,在AIGC引擎下,企业只需上传原始材料即可自动检索素材、提炼回复,降本增效效果显著。”
在徐懿看来,“我们肯定没机会做大模型,中国大部分创业公司也是如此,但基于大模型可以跟我们的很多产品相结合,从而在应用场景里提高效率。”
时刻紧绷着那根弦
智齿科技创立以来,徐懿、吴立楠等几位联合创始人一直有着强烈的危机感。
“我们时刻都紧绷着那根弦,担心是否会被超越或颠覆,国内大部分互联网创业公司都面临‘不进则退’的窘境。”吴立楠说。
智齿科技的危机感在ChatGPT问世后,体现得淋漓尽致。
2022年11月30日ChatGPT发布后,接收到各种消息轰炸后的徐懿等人,意识到绝对不能错过这次机会。12月份,徐懿迅速拉人组建了内部AIGC讨论的微信群,每天都会把自己看到的最新消息扔到群里,时而发一个脑图,时而是外媒报道的相关链接等等。
一开始,项目组相当于被徐懿推着迅速前进,但没有特别清晰的目标,只能从不同角度去讨论产品的哪些功能需要被AI赋能或加强。
之所以这么迫切,是因为智齿科技全公司上下担心ChatGPT会颠覆整个客服行业,一旦走慢一步,就有可能被人超越,甚至被新生的产品或事物完全取代掉。
吴立楠认为这并非危言耸听,2013~2016年服务商集体SaaS化、云化时,就导致转型慢的企业纷纷掉队,当时智齿科技凭借推出SaaS版AI机器人才站稳脚跟,一步一步发展至今天。而如今也有可能因为一个新技术的出现,把之前所有努力全部抹掉,不仅不需要现在的功能,甚至可能连(聊天)界面都不用了。
今年2月份,智齿科技成立了AIGC研发的专项项目团队,产品、算法、研发等部门的VP每周都要和吴立楠、徐懿等人开脑暴会,同时市场部开始做客户调研,寻求痛点。调研后发现,客户提及最多的是知识库初始化配置与维护、机器人会话接待等部分,这也成为智齿科技研发Sobot AI(在线客服机器人与 AIGC融合能力)首要解决的问题。
巨大的内外部压力下,不到10人的AIGC专项组,在4月4日上线了Sobot AI的1.0版本。
据吴立楠介绍,研发的同事每天不停地打电话、讨论,嗓门大得仿佛像在菜市场吵架。
整个项目团队高速运转下,智齿科技以“周”为周期迅速更新产品,不停迭代小版本,到6月中旬,他们已经在做1.3版本的更新。
一边是研发团队在高效测试迭代产品;另一边,智齿科技市场部及产品团队也在同步推动国内外大模型厂商的合作。
最终在很短的时间内,智齿科技就完成了与国内外多个大模型厂商的签约合作。
Sobot AI上线一个月后,就有130余家企业找到智齿科技申请测试。在这期间,吴立楠和研发小组也曾遭遇巨大挫折,因为通用大模型的弊端,导致一段时间内,AI输出的回答超出了文档提供的内容范围,最严重的时候测试数据的错误率超过60%,这在to B领域是完全无法容忍的错误。
吴立楠和团队甚至开始质疑大模型是否能够应用在客服问答场景里,一旦问题无法解决,团队之前花费在大模型辅助问答的时间精力就全都“打水漂”了。所幸,6月初,研发团队通过反复训练微调模型解决了这一问题。
未来,智齿科技还将在调用大模型的基础上,将AIGC的能力附加到知识库的泛化、客服赋能、服务小结等功能上。
远离自研大模型战场
随着国内大模型厂商陆续推出新模型,智齿科技的AIGC项目组又多了一项工作,即调用国内大模型接口测试数据。
去年12月到今年1月,公司处于比较痛苦的阶段——当时国内没有商用大模型,国内厂商只能调用国外的有且仅有的唯一接口,还存在排不上队的风险。百度、MiniMax等国内厂商的大模型陆续推出后,项目组才同步开始测试。
为了加快测试进度,智齿科技的技术和产品部门想到了用GPT-4给其他大模型生成内容打分的操作,以GPT-4是10分为标准,GPT-3.5是九点几分,其他的都在8分以下甚至更低。不过GPT-4的评分存在一定主观因素,为保证客观性,项目组也会抽取一些问题跑测试进行标注,对比实际效果。
吴立楠也表示,如果以百分制进行打分,在他们的一轮测试里,国内大模型几乎都只有三四十分的水平。这也就意味着,一旦现在的接口无法使用,智齿科技将在一段时间面临AI生成内容质量下滑的情况。
尽管如此,当问到是否会去做自己的大模型时,吴立楠依然坚定地表示:“不会。”
“大家已经看到了OpenAI训练一次模型的成本,GPT-3.5是几百到1200万美元,GPT-4据说要上亿美元。”在吴立楠看来,这对于智齿科技及其他类似的垂直厂商而言,负担过重,目前账面上的钱是“烧不起”的。
智齿科技投资人也曾与公司的联合创始人就是否自研大模型一事沟通过。他们表示,如果智齿科技团队有信心做出世界最好的大模型,就可以考虑自研,否则直接“躺平”是最好的选择。
来源:受访者
现在智齿科技调用的大模型是按照2美分/1000个token(大约500个中文字符)收费。因为是混用几个模型,有的模型甚至更便宜,只有零点几美分。这对于智齿科技而言是当下最具性价比的选择。
同时,吴立楠也告诉《中国企业家》,“当下,如果创业公司All in大模型,我觉得是有可能的;但垂直领域如SaaS、金融等行业的创业公司,如果突然说做出了一个(垂直领域)大模型,我觉得这件事要画一个问号。自研大模型的投产比,对于创业公司,尤其是目前的智齿价值并不高。”
在追求极致产出比的情况下,即使是基于大模型接口进行产品升级研发,智齿科技的投入也非常小心谨慎,每一步确定清楚之后,才会继续进行研发测试。
同时,智齿科技团队一直在测试国内大模型,也是为了保证程序的稳定性。未来一旦无法继续跟国外大模型厂商合作,公司也会提前选好合适的国内备份替换。
值得注意的是,大模型在客服行业的应用,距离想象中的颠覆性变革尚有距离。对于现有的行业或产品技术,它带来的不是颠覆或替换,而是增强或赋能。
“以客服行业为例,AIGC生成的内容,只是在原有产品的问答、算法上做加法,提高直接回答率和准确率,以此缩减转人工次数,甚至能赋能人工客服等。在短期内它无法实现技术替换,只能进行赋能。”吴立楠说,“不过长期来看,它在软件行业里应该会逐步实现技术替换。”
新闻热线&投稿邮箱:[email protected]
值班编辑:姚赟 审校:张格格 制作:吴莹
关注“中国企业家”视频号
[ 推荐阅读 ]
微信扫码关注该文公众号作者