面向数据领域,这家AIGC公司种子轮融了750万美金公众号新闻2023-02-08 10:02来源丨深思圈题图丨摄图网最近关于AIGC或者说生成式AI的讨论非常多,随着时间的推移,越来越多各种类型的产品开始出现。当下AIGC比较好的切入点还是在垂直领域SaaS这一块。今天给大家介绍的就是这家公司——Seek.ai就是这样的一款产品,主要定位于面向数据场景的生成式AI,借助底层的大语言模型,使得用户可以直接通过自然语言的方式获取数据相关的回答。这家公司刚刚公布了由Conviction Partners、Battery Ventures以及Snowflake CEO共同参与的750万美金种子轮融资,这样的种子轮规模在如今融资环境非常不好的情况下,就显得难能可贵了,今天就让我们一同来看看这究竟是一款什么样的产品吧。基本情况首先来看看公司创始团队,两位核心C-level的成员都是女性创业者,分别是CEO Sarah Nagy和CRO Sarah Smith。CEO Sarah Nagy本科毕业于UCLA的商业经济系,之后又在普林斯顿拿到了金融学硕士学位,之后就一直在从事数据和量化分析相关的工作,在数据行业有着十多年的经验积累。她在2021年6月离开了Citadel,并在9月份正式创立了Seek.ai。比较特别的是Seek是一家位于纽约的创业公司,而不是传统意义上一家硅谷的Startup,这也可能跟数据与金融密不可分有关,纽约毫无疑问是金融数据的中心。Seek的核心目标是:Seek What Matters,也就是寻找到重要的东西,想要解决的核心痛点就是帮助企业内部人员去解决繁琐且重复的数据需求(Ad-Hoc questions),也就是说即使是非技术的人员,也可以通过Seek来快速实现数据分析。图源:Seek本轮融资的BPNagy自己在过往作为数据分析师的经历中,发现很多非技术的同事经常会找到她,并给出各种非常细碎繁琐的数据需求,这类需求往往都是重复性机械的劳动,没有什么技术含量,却占用了她大量的时间,而这些时间本可以用来做更多有长期价值的研究性商业分析。而对于那些非技术的同事来说,他们也会感到非常麻烦,因为一有什么业务上的数据需求,他们都需要求助另外的人员,而非自己直接获取相关的数据。这个现象在整个行业内都存在,有极强的普遍性。因此,Nagy想要做的就是一款可以解决这个痛点的AIGC产品。Seek的核心产品是一个为数据分析服务的自然语言交互界面,这也是之前文章里提的新一代AIGC产品所拥有的全新交互NLUI(Natural Language User Interface)。这款产品可以跟企业现有的云数据仓库相连接,然后通过Slack、Microsoft Teams和Email等交流工具来获取相关的数据和分析结果,这是比较典型的Ad Hoc query的使用场景。同时Seek会存储每一次提问以及对应回答的结果,并在之后的相似请求中更快给出对应的结果,通过这样的方式,Seek可以形成自己的产品飞轮:拥有出色的用户粘性→将更多的用户粘性转化为更好的模型性能(及时改进、模型微调、把用户选择作为标记训练数据)→使用出色的模型性能来推动更多的用户增长和留存。大家可以看下面这个Demo视频来进一步了解Seek想要解决的具体问题和场景,以及对应的解决方案。从获客方式上看,由于Seek自身产品定位于企业内部的数据,所以在早期连接数据的整个Onboarding过程还是需要人工来进行对接操作的。因此目前官网虽然有Start Free Trial的按钮,但用户还是需要填表来获取产品的体验权限,但在未来等到产品打磨到一定阶段应该还是会采用PLG(Product-led Growth)的方式来实现增长获客。AI在产品中发挥的核心作用就是——代码生成,而随着大模型的发展和成熟,根据Seek在BP中的数据显示,如今AI生成代码的准确率在2020~2021年期间上升到了72.3%,这一变化为自然语言获取数据提供了新的可能性,这也是为什么他们选择在这个时间点开始做这样一款产品的原因。这也是我个人非常赞同的一个AIGC创业逻辑,大模型的成熟给很多原来没办法实现或者需要投入很多资源的需求提供了新的解决方案,基于这样的变化,给了很多初创公司用新的解决方案来解决老问题的机会,并且打破了很多大公司的先发优势和壁垒,这也是为什么之前文章红杉讲生成式AI是新一轮平台级创业的机会。在底层模型的选择上,根据Nagy的访谈信息来看,Seek采用了多模型的策略,而不是单纯基于某一个大模型,比如GPT-3来做生成。并且Seek会根据不同用户的行业属性和数据要求,来为每一个用户都fine-tuned对应的数据模型。目前,Seek主要服务了10~20家公司,包括一些初创企业和财富100强的大公司。从行业需求和目标人群看,越来越多的行业开始紧密跟数据结合,越来越多的公司也开始做data-driven的决策,并且呈现出数据可触达性越高,相应的公司表现就越好的趋势。比如在海外市场,很多SaaS的销售就非常依赖于各类数据需求,据Nagy访谈的数据显示,每个销售平均每周会有20个ad-hoc的数据问题。除了SaaS行业外,Seek目前服务的客户还来自Fintech、消费品和电商等垂直行业的公司。而在目标人群上,Seek在其官网主要列举了4类人群的使用样例,分别是客户成功、销售、产品和数据团队,通过使用Seek,这些人群快速高效的实现了自己数据查询和分析的需求,降低了获取数据的时间和沟通成本。而就在今天,Seek.ai又推出了一款全新的应用产品:DeepCuts。这款产品主要面向的应该是C端用户,当用户连接Spotify之后,就可以用自然语言来生成SQL查询对应的音乐数据信息,并且在首页点击即可进行实验,同时还可以看到对应自然语言生成的SQL代码,整个体验效果非常不错,很容易让人在第一时间感受到产品价值。Seek应该也是发现了单纯针对企业数据型的产品比较难走PLG的路线,这样可能不利于抓住目前生成式AI的热潮,所以抓紧推出了一个针对C端的产品达到引流的效果。这一点也体现了DeepCuts首页上,用一行显眼的蓝色引导用户填写信息,把Seek用到自己的business上。同类产品Mason(Mason.app)这是一款定位于用最快速度写SQL、做可视化以及分享的产品。Mason的3位创始人最早都是在社交购物网站Tictail工作,在Tictail被Shopify收购之后又都到了Shopify,并在2021年底从Shopify出来成立了Mason。他们在2022年底宣布拿到了由CREANDUM领投的170万美金Pre-seed融资,其中跟投的还有Shopify、Pitch和Eventbrite的联合创始人等个人投资者。跟Seek的CEO一样,Mason的CEO Anders Berntsson之前也做过数据分析的工作,也遇到了自己日常时间被各种Ad-Hoc问题给淹没了的痛点。他认为解决这一问题最好的方式是让团队里的所有成员,包括非技术的同事都尝试学习SQL,并由他们自己来解决对应的数据需求。基于这样的一个出发点,Mason定位于团队内部协作的数据分析工具,非常强调通过Mason实现数据团队和其他业务团队的协作,从而让数据在团队内部触手可及。同时Mason还可以帮助数据团队更快捷的写出SQL和分享对应的SQL代码来取得数据,并将每一次查询请求沉淀下来。在今年的1月份,他们又发布了基于大模型开发的AI Assistant,这个功能就跟Seek很像了。用户可以用自然语言的方式来提问,Mason会自动生成相应的SQL代码,或者可以选择一段已经写好的代码,AI会自动修改编辑这段代码。此外这个AI助理还可以学习用户数据库的schema和query历史,然后自动生成对应的答案。通过这样的方式,不仅让整个写SQL的过程变得更轻松更快速,同时也让更多非技术人员有了直接从数据中获取答案的能力。同时Mason还特别强调一点是,跟直接图像生成不同,利用SQL取数生成图表,整个过程十分透明,并且可控性很高,如果有问题可以直接看代码来debug,而不是像文本生成图片那样最终结果是不可控的,需要靠大量尝试不同Prompt来调优。可控性和可靠性对于一款To B,特别还是企业数据类的产品来说至关重要。从产品进度上看,目前Mason也还处于早期阶段,官网上只有Request access填表联系的按钮,还不能直接下载产品体验。但其官网已经又了对应的收费方式,主要是按人头订阅付费,价格是12~14美元。Olli(Olli.ai)Olli给自己的定位是团队的AI数据分析师,核心目标是通过Olli来打造data-driven的团队,目前支持的核心三大功能是回答数据问题,生成Data dashboard(数据仪表盘)和分享洞察。Olli的创始人Sean Doherty很年轻,20年毕业于波士顿大学,之后做过一些实习和兼职,然后就是自己开始创业。他在2021年开始这段创业,但在一开始的方向是给Fintech的开发者提供一个连接股票交易账号、并支持查看实时数据和进行交易的API,这款产品名称叫做Realize,并在2022年4月份宣布拿到了由Y Combinator、Craft Ventures和Global Founders Capital共同参与的190万美金融资。但在2022年底,他们转型开始做了Olli这款产品。我在很早期就关注到了Olli,在一开始他们还叫Chula.ai,主要做的是自然语言生成静态的图表,比如柱状图、直方图和饼图等。之后在新版的迭代后,他们把产品名称改成了Olli,并拓展了其AI能力到整个数据分析这一块。根据其官网案例信息介绍,用户可以直接通过自然语言来获得比如产品留存、增长以及什么样规模企业是留存最好的等数据相关问题的回答,并且支持将这些需求通过SQL转化成动态实时更新的Dashboard。此外,Olli支持直接连接snowflake、databricks、amazon S3等云数仓,同时也支持直接集成到Google Sheets和Excel中。从产品进度上看,Olli也不提供直接的产品上手体验,用户需要点击Get access按钮,填写相关信息后会有专人联系,并进行相关的产品体验和测试。Decile(Decile.app)这是一款独立开发者的产品,主要定位就是利用AI来赋能数据导向的组织,用户只需要通过提问的方式即可获取到想要的数据。Decile是一个数据分析工具,目前支持连接Postgres的数据库。在连接完成后,用户可以通过自然语言或者直接SQL语句实现查询、可视化和分享等功能,同时还支持定时自动执行对应的查询。比较有特色的是Decile还提供了一个学习SQL的线上教程,可以帮助用户快速学习SQL并且利用自然语言更好地生成对应SQL的代码,得到想要的数据结果。虽然这是一个独立开发者的产品,但却是唯一一款可以直接上手体验的产品。这也是我观察到的一个比较有趣的现象,很多独立开发者的产品往往面临尽快盈利的压力,所以会尽可能早的放出可以使用的版本,并且在一开始就会有对应的定价收费方案。相反,一些有了融资的产品在早期可能更注重产品完成度和打磨上,往往需要联系对应的人员才能进行体验。Decile目前已经支持线上直接注册并体验产品,同时还提供了开源的版本,企业用户可以利用Github上的开源版本进行私有化部署。目前官方的SaaS版提供了三种定价方案,分别是19美元/月的入门版、49美元/月的团队版和149美元/月的企业版。简单试用下来看,Decile目前在自然语言请求查询数据、总结各类数据以及问答等方面还是有着不错的使用体验的,同时提供的线上SQL学习教程也非常不错,支持直接通过上手操作来学习对应的SQL语句,并且整个学习过程跟Decile产品的结合十分紧密。通过这样一整套的解决方案,可以帮助团队的非技术人员快速上手数据分析,实现数据驱动。总结最后总结一下,从技术实现上看,我个人推测这类产品整个大致的Pipeline应该是:自然语言输入→大模型可以接受的Prompt→大模型生成SQL→执行SQL得到数据→将数据结合自然语言输出从上面这个流程来说,核心关键点在于将自然语言转换成效果不错的Prompt以及用Prompt来生成对应的SQL的准确率。其实Text-to-SQL本身这一方向研究早在NLP时代就已经有很多的尝试了,比如当时比较流行的WikiSQL和Spider这些标注数据集,这里面主要的评价方法包含了Exact Match(精确匹配率)和Execution Accuracy(执行正确率)这两种。在此之前很多做智能BI的公司也会有类似的自然语言实现查询的功能,但在当时效果都不怎么样,所以这一块领域并没有真正发展起来,对于初创公司单独去做这样一款产品也相对比较单薄,容易出现吃力不讨好的局面。但有了大模型之后,在此基础上可以通过API接口来快速实现自然语言转SQL的能力,无疑大大降低了初创公司进入的门槛,对于这类公司来说目前核心难点还是在于准确率上,这也是所有涉及到数据这块必须要面临的一个tradeoff——Accuracy(准确性)和Accessibility(易用性)。如果说这类工具可以把数据分析这一能力进一步扩展到更多人群,伴随着到来的就是准确率的降低。目前来说,无论是Seek还是Mason采用的应对方案都是让数据团队先行的策略,也就是将准确率交给数据团队来把关,并借助工具进一步加速团队内部的数据分享与流通,并最终实现data-driven的目标。我个人还是蛮看好这一方向的,因为需求和痛点很明确,而且市场也足够大,针对不同行业属性需要有不同的场景理解和模型来支持,因此各个行业可能都会有对应公司存活的机会,早期竞争就不会那么激烈。此外从技术解决方案上来看,确实正如Seek的BP里讲到的那样,随着大模型的成熟和发展,当下已经是到了一个比较好的拐点。而且从底层大模型看,文本和代码生成这块的模型已经是比较成熟了,创业公司在此基础上做应用,相对来说确定性比较高。相比较而言图像和视频等领域大模型则还处于早期的阶段,创业公司在做应用时难免还需要考虑大模型本身能力限制以及未来发展方向等不确定因素。当下这一波兴起的数据生产力产品,本质上就是Data democratization(数据民主化)的趋势。在数据之前,还有Code和Design等行业的democratization,从而带来了Webflow、Bubble和Canva等产品的兴起。democratization意味着随着生产力水平的提升,使用门槛的降低,从而带来更广大的使用人群。在此之前,他们可能因为上手门槛等问题,被痛点困扰,但需求始终没有得到很好的满足。每一次使用人群的扩大,对于创业公司来说都是一次非常好的机会,因为这意味着原来的巨头垄断和先发优势将被打破,新的人群会需要基于新的解决方案的产品。参考材料[1]https://techcrunch.com/2023/01/11/seek-lands-7-5m-investment-for-ai-that-answers-domain-specific-questions/[2]https://www.businessinsider.com/pitch-deck-seek-ai-generative-raise-pre-seed-seed-funding-2023-1[3]https://mason.app/blog/introducing-ai-assistant2023最热投资趋势预约直播围观吧👇👇👇微信扫码关注该文公众号作者戳这里提交新闻线索和高质量文章给我们。来源: qq点击查看作者最近其他文章