秘塔科技:“中国的Grammarly”如何应对GPT时代的“降维打击”

科技

2023-05-09 13:05

作者|苏小如

编辑|James

ChatGPT爆火以来，帮助文本、视频等内容创作者提高工作效率的AI辅助创作工具大量涌现，备受关注。娱乐资本论访谈了秘塔写作猫、一览运营宝、一帧秒创三款产品的开发商，试图向读者揭示此类应用的发展现状、商业模式和未来走向。

“2021年，我们推出纠错功能时，用户70万。2022年底，改写功能上线后，用户涨到了400万。今年，我们希望秘塔科技的用户可以至少涨到千万以上。”

在以ChatGPT为代表的生成式AI技术引发热议时，秘塔科技COO王益为明显感受到了用户和资本的热情。公司曾在2018年和2021年分别融资，如今不仅用户量明显见长，投资人也再次找上门来，具体细节正在洽谈。

秘塔科技2018年成立，最早做法律翻译，之后研发了给文章修改语法错误的“写作猫”，被称为“中国版Grammarly”。去年12月，写作猫上线一批AI功能。今年2月，他们类ChatGPT的聊天AI“对话写作猫”上线，是“国内首发”。

用户以学生和文字工作者为主

娱乐资本论：秘塔科技的产品主要针对哪些用户？

王益为：一半是学生。2022年，秘塔的同义改写和降重功能上线后，全国超1/5的毕业生，即200万人使用，用户数一年增加了300多万。

在白领中，新媒体、公务员、教师这些重度文字工作者都是我们的目标人群。我们发现大家的痛点是“水”一些文章，比如期末考试的论文、学习心得、思想汇报及写小红书文案的需要找灵感，拓展写作思路等。

未来，我们希望在稳住学生基本盘的情况下，拓展更多的文本类型，对产品进行强化学习。比如，现在微信小程序排名第一的日报周报工具就是我们做的。在相对程式化的文本类型，和偏工作场景的应用方面，秘塔希望做到垂类第一，这也是我们产品擅长的方向。

娱乐资本论：写作猫的文字纠错功能，以及AI生成内容都有转付费的门槛。用户可以免费生成10000字，之后要购买额度。那么C端用户是因为要纠错，还是因为要生成内容而转付费的比较多呢？

王益为：AI生成内容转付费的多。纠错这款产品我们做的挺好。就拼写的同音错字等方面来说，比Word这些内置的拼写检查效果更好。但是大家对错别字的容忍度都挺高的，纠错不是刚需。

娱乐资本论：你们的大模型是自己开发的，主要有哪些自主的创新点？

王益为：我们的底层架构是transformer，但搭建模型上我们有自己独特的方法和方向。

文本类的大模型技术门槛很高，否则我们追赶 GPT也不会那么难。但其实模型的难不在于大小。你做1万亿参数的模型，也不意味着你输出的结果一定是好的，模型大小还是要为你的输出结果服务。

我们的语料来源是自己准备和处理的数据，包括大量多音字、谐音字，专有名词，是纯中文的训练语料。所以我们的产品应该会更符合中文文本习惯。

我们发现自己用户之前上传的文本材料不适合用作语料，况且我们也不能使用。好在公网上获取内容很容易。

娱乐资本论：有什么你们研发、运营中遇到的困难，是难以被你们用户理解的？

王益为：生成式AI产品有一个不可能三角：成本，可信度，多样性。

用户对可信度的要求高，但没意识到可信度不是机器学习擅长的领域，AI不是搜索引擎。这个概念没植入到用户心智里，他用了发现机器在“胡说”，就说产品不好使。

对可信度要求没那么高的场景里，AI擅长拓展内容的多样性。比如小红书营销文案——同样是卖一把椅子，能有成千上万种翻着花的写法描述它。营销号、类似“震惊体”风格的东西，机器也很容易生成，我们产品的表现甚至比GPT还好。

娱乐资本论：准确性和可信度是AI的短板。但在国内运营，必须避开敏感内容，你们会怎么做？

王益为：我们会进行专门的算法优化，但依照新的《征求意见稿》来说，如果内容出错，产品也要担责。对于开放式的大模型交互来说，出现问题几乎不可避免。所以在内部实验性的“对话写作猫”中，你会看到比秘塔写作猫更严格的限制措施，换句话说，它回答你问题的效果是不如我们正式版那种非对话式的工具的。

娱乐资本论：你能分辨出哪些内容是写作猫生成的吗？比如“GPT文体”，喜欢分1、2、3条说，最后给你来个“总之”。

王益为：如果是全篇还有可能，如果AI只是续写了一部分，是看不出来的。

娱乐资本论：你担心别人会通过生成后的成品，反向识别你的调优逻辑吗？

王益为：现在的所谓“AI检测工具”都有一定缺陷。我知道OpenAI官方和第三方有一些针对ChatGPT生成的文本痕迹的研究。从技术的角度说，如果某个工具专门研究反向识别研究我们写作猫这一款模型，它可能有一定几率检测出来，前提还得是对模型本身非常了解。但是，不可能存在一个工具能开放性地检测出世界上各种不同的大模型生成出来的内容。

娱乐资本论：现在在AI写作界面里，其实也是有类似Microsoft 365 Copilot或Notion AI这种“斜杠”呼出的方法的吧？

王益为：是的，这个界面是为了引流，主要是大家被教育得喜欢这种方式。不过，对话不是内容生成的合适场景，从大家实际用于工作的内容生成角度而言，范式应该是你给它题目，列个大纲，它往下写完这样。

如何应对GPT们的“降维打击”

娱乐资本论：ChatGPT带来的火爆局面对你们有什么影响？

王益为：由于用户受到教育，更好地认识到同类AIGC应用的好处，我们的C端用户增长整体保持在去年同期的3倍。今年，我们期待能有千万以上的（C端用户）注册量。收入增加了，才能做更多的研发和市场投放。

我们的C端用户付费率在4%左右，但B端由于竞品增加，客户并没有展现出和C端用户同步增长的趋势。

娱乐资本论：在国内，GPT可能受到政策限制，而百度或WPS这些带来的竞争可能更为直接。

王益为：没错。WPS AI刚刚官宣不久，他们是跟minimax（AI对话应用GLOW的开发者）合作的。如果企业方面之前已经购买了他们的服务，而AI功能又包含在服务里面，不额外收费的话，确实可能会削弱一部分企业的付费意愿。

但这事有趣的地方在于，中国做大模型AIGC的公司，在GPT出来前没有提供C端服务的，他们首要目标是做B端。所以写作猫在这个角度来说，是没有用户认知意义上的“竞品”的，给了我们占领用户心智的时间。此外，我们的大模型也是自己的，是为了秘塔写作猫这个产品服务的，这也是我们和大厂对抗的一点底气。

产品设计上，我们也没想让同一个产品生成所有的文本类型，而是给它选择合适的文本类型，进行专项的数据训练和后期的增强学习，不断强化它。

娱乐资本论：你们获得B端客户的渠道主要是？

王益为：我们的打法是“自下而上”——从C端注册用户中找到B端的销售线索，让员工用上觉得好，去影响他们的老板。我们提供网页版产品的企业版，企业也可以接入API自行调用。

目前，我们B端的客户大概有几千家，包括互联网大厂这些，知名媒体等。还有同义改写文章的需求，实际上被一些内容生产商拿去用来应对搜索引擎的去重机制。秘塔的产品做这件事性价比高一些。

娱乐资本论：现在要继续争取B端客户，你们有什么应对办法？

王益为：我们的产品在一些专项任务，比如公文写作方面，已经达到了很高的水平。我们自己就在用自己的技术，来解决自己遇到的困难。我们用了三天时间让自家产品协助整理200多份报给政府部门的算法描述和安全评估申报文件。即使跟 GPT相比，我们也在公文的行文顺序，谈问题的角度等方面表现更好。

为了能一站式满足更多客户的多样需求，我们也尝试着做虚拟人，将我们大模型的能力嵌进去驱动虚拟人，可以做更多样的应用。因此我们也展开了相关招聘。

而且，我们可能会推出其他需要对话能力的产品形态，比如法律咨询产品。

其实秘塔就是做法律起家的，我们最早的产品就跟法律咨询、法律文本翻译等有关。到现在我们这些专业产品还在继续做，我们和北大法律人工智能实验室建立了紧密的战略合作关系，在算法和应用场景方面共同探索。

法律咨询满足了生成式产品中不可能三角的另外一角，可信度高。它最终产出的产品形态，有可能是通过几轮对话，由人和机器交互得到靠谱的法律咨询结果。从这个角度来说，我们有必要让大模型有对话的能力。

这种法律咨询系统的上一代产品是填表式的触摸屏，填表得到相关咨询的答案，这个对用户的要求比较高，不太好用。我们在研发的新产品应用了大模型的对话能力，再加上数字人作为外表，便捷性和准确性上都会有质的提高。

娱乐资本论：做这款产品时，你们技术上遇到了什么问题吗？

王益为：刚开始研究时，我们是用法律类的知识图谱规则引擎生成准确的结果，但进展缓慢。举个例子，我们在北大法律人工智能实验室里做了一年半，才完成了婚姻家庭这部分的咨询系统。

娱乐资本论：用知识图谱做对话，会不会对提问者的要求非常高？

王益为：是的。机器抓取人机交互中的关键词，解析这些自然语言对应哪些问题，输出结果，为了保证可信度和可解释性，整个过程费时费力，效率很低。但大模型给了我们新的思路，就是我原本的知识图谱只需要做好梗概，再让大模型强化对法律类知识的学习就行。大模型学习这些知识，只需要三个月就能完成。

新版产品在使用时不用想太多，输出的内容会先到知识图谱中验证再输出，这是我们解决产品可信度的思路。

我们接下来将会到一个国家级的人工智能社会治理示范区推出这款产品，也是项目的阶段性成果展示。

娱乐资本论：当年人们把你家跟Grammarly相提并论，但现在他们在GPT面前也多少有点“自身难保”的意思了。

王益为：GPT 对文本类的通用任务所造成的打击就是一般“杀鸡不用牛刀”，但现在这把“牛刀”卖得比杀鸡的刀还便宜。所以我们压力非常大。

去年Jasper也是非常牛的案例，它有1000万美金的营收。Jasper是接大模型，在营销的文案场景上进行调优。ChatGPT出来后，它现在寻求被收购。因为Jasper没有自研的大模型，不能根据自己的应用场景提高生产力，只能被GPT碾压甚至取代。

以前人们不相信，你不通过专门的方法去训练一个专有领域，它能做到“大力出奇迹”。GPT-3.5/4出来前各家也有模型，但更多属于技术路线上的探索。只有 OpenAI大模型技术在几十个任务上都能达到“80分”的程度，大家才知道原来这条道路是能跑通的，才赶紧拿出自己的产品。

我们现在特别认同Midjourney的发展方向。它们在图片生成领域里做到了极致，20个人的团队做到1亿美金营收。这也说明了模型不求大，而是要把一件事做到最好；技术和产品要结合在一起往前走。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章