对话Traini:4人创业公司用大模型翻译“狗语”,已获得20万用户
邮箱|[email protected]
前阵子,一段宠物主人与自家狗狗“对话”的短视频在社交平台火了。
“Eli,你能帮我把遥控器拿来吗?”博主对着手机说。
这段人类语音立马被翻译为一段哼鸣加几声短促的吠叫。
然后神奇的事情发生了:眼前这只叫Eli的金毛犬真地听懂了指令,自己跑去茶几叼来了遥控器!
类似的还有下面这个,主人问能不能给自己一个kiss。狗狗聚精会神听完软件翻译,马上望向主人,飞扑上去献吻一个。超级有爱,让主人又惊又喜。
这款「AI狗语翻译器」由总部位于硅谷的宠物共情AI初创公司Traini开发。他的产品构想是:通过其AI聊天机器人PetGPT,用户不仅能和狗狗跨物种对话、无障碍交流,还能听懂它是饿了、无聊了、还是委屈了,随时了解自家毛孩子的心理状态和身体需求——对万千铲屎官来说简直是梦想照进现实。
作为一家出自华人创始团队的AI新秀,去年全年,Traini用户增长了600%,冷启动情况下iOS注册用户超过20万。今年短视频爆火之后,Traini的5月产品浏览量更是逾百万,在YouTube积累了2千万观看量。
核心技术原理
虽然早期市面上也出现过一些简单的宠物声音识别程序,但Traini的狗语翻译技术却是基于一个更先进和复杂的宠物行为多模态翻译模型。它采用类似GPT-4o的Transformer架构,被投喂了海量的专家级宠物行为学文本、视觉和音频数据,是Traini的看家法门之一。
受到语义空间理论的启发,Traini认为,既然人的语言可以是“词向量”,那么“汪汪也可以”。为确保狗语翻译的准确性,Traini团队尝试了多种训练方法。包括使用纯狗语音数据训练,对人类语音预训练模型进行微调,和使用来自不同国家地区、不同品种狗的语音数据混合训练等。
现在,团队已经从世界各地收集了超过10万只狗狗的声音和面部表情图像,创建了目前最大、最具多样性的宠物情感表达数据库。
有了扎实的数据打底,Traini不光会翻译狗语,还能分析宠物的行为意图和情感状态,促进其心理健康。它可以解读10种不同的宠物情绪,远超基本的快乐、悲伤、愤怒和恐惧。
用户直接在PetGPT中上传照片并提出问题,比如“看看我的狗怎么了”,或者“什么补充剂适合这个品种的狗狗”,就能得到相应的专业帮助。据团队称,Traini在行为翻译方面的准确率已达80%。
随着数据规模的扩大,包括收集产品使用过程中自然生成的行为数据,以及模型性能迭代,准确率也会不断提高。
个性化配套功能
这也引申出Traini除了宠物语言和行为翻译外的另外几项功能:
一是宠物医疗辅助。比如下图示例,PetGPT听出第二段狗狗语音是“焦虑的吠叫”,解释说这种类别“通常音调高、重复,并可能伴有踱步、哀鸣或破坏性行为”,原因包括分离焦虑、对特定刺激的恐惧或环境不适等。建议“提供一个安全舒适的环境,保持一致的日常生活,并尽快咨询兽医。”
二是个性化服务推荐。Traini的目标是建立一个宠物AI代理,基于上下文具体问题提供精确的服务和产品匹配。从而使用户能够轻松搜索信息、下订单、预约医生等。还包括了100多个有趣的Traini线上训练课程、AI定制的行为矫正计划、及宠物星座和疫苗记录等。据官方数据,PetGPT服务推荐的点击率超过30%。
此外, Traini还有一个视频分享社区,供宠物主分享故事和经验,也能从中快速获取用户反馈。
至于商业模式,Traini采取双轨并行策略:一方面提供C端消费者订阅服务,允许个人用户访问其宠物共情AI平台、使用在线训练课程等功能。另一方面专注企业市场,为宠物诊所、宠物硬件公司和研究机构等提供API,实现宠物在医疗和日常生活中的智能互动。
华人创始团队背景和融资
Traini团队精简高效,由4名全职员工和部分实习生组成。主打一个分工明确,配合紧密:
创始人兼CEO孙邻家 (Arvin Sun) 是一名华人连续创业者,拥有超过12年本地生活服务数字化创业经验。此前担任知名华人外卖平台GESOO CEO,也曾是美国最大亚洲外卖平台Chowbus西海岸负责人,帮助公司共筹集超过1亿美元资金。他在Traini肩挑客户增长和市场拓展。
联合创始人Jason Hong曾是中国湖南省数学培训队成员。并在Scale AI、OpenAI和百度美国担任过机器学习工程师,积累了先进模型的开发实践经验,负责核心PetGPT模型架构和训练。
另外两名全职员工分别负责Traini的界面设计和全栈工程搭建。公司还邀请了前Chewy数据科学负责人Yiyi Yang加入,担任宠物健康专业顾问。
就在一周前,Traini刚刚官宣其5月完成的千万元天使轮融资。由FutureX Capital、BlueSea Partners、Success Giant等投资者联合参与,包括前Meta工程总监Yingyi Liang、Instacart子公司Caper AI工程主管Lily Zhang等。现有股东Valkyrie Fund I LP、Fengmin Gong继续跟投。
带着更多对Traini产品和团队的兴趣,我们也与创始人孙邻家进行了一场深入对话。
对于硅谷许多认识他的风投和一线AI从业者来说,这也许就像一个老朋友转向AI+赛道创业,忽然爆火又融资成功的故事。
但聊下来我们发现,Traini背后其实是孙邻家十余年用户增长经验的积累,早在ChatGPT诞生前就开始对宠物行业的深入观察,以及整个团队大量的科学调研、数据收集和模型训练。
以下是对话实录:
硅星人:请Arvin先介绍一下自己吧。
孙邻家:我是一名连续创业者,在国内创业了7年。最早是大学时和室友一起向刚入学的新生卖被子。当时觉得自己需要积累经验,毕业后就去了一家上市公司做供应链管理,差不多做了两年时间。
2015年我和同学一起创业,第一个项目是做零食专卖店「邻家铺子」,三公里内30分钟送货上门。第二个项目是为美容院提供在线预约和门店端的SaaS服务,我们在3个月内融了几百万。再之后我又做了一个给电商提供配套物流的平台,融到3000多万,团队有100多人,业务覆盖了50多个城市。
2018年我来到美国,加入了最大的中餐外卖平台GESOO做CEO。当时面临的最大挑战是适应新的国家、商业环境和法律法规等问题。经过几个月努力,也让公司扭亏为盈,并将业务扩展到多个城市。
后面我去了另一家竞品公司Chowbus负责西海岸业务。当时它规模很小,只融了400万美元种子轮。我们花了半年时间完成6300万A轮和B轮后,又融了4千万,总共超过1亿美金。2022初我离开Chowbus,全职投入现在的项目Traini。
硅星人:当时生成式AI还没有火吧?
孙邻家:我们做的事情没有完全跟随AI的脚步。实际是在做外卖平台的时候,我发现很多客户要求司机代买狗粮,就想通过狗粮来拓展业务。做了市场调研后发现这个领域的数字化程度不高,特别是疫情期间宠物数量和服务需求剧增,有很大机会。
我到公园随机做了2200个用户调研,有76%的用户表示他们的狗有行为问题。所以我们从狗的行为训练切入市场,建立了一个C to C社区,但发现效率比较低,就进一步转向智能社区,用机器人来回答用户问题。
正好大模型也在快速发展,让应用和技术可以完美结合。我们一直在增强针对宠物领域的大模型性能,以提供更好的服务和推荐。经过10个月优化,Traini用户几乎都在使用PetGPT,通过聊天的方式来纠正宠物行为问题,获得专业信息和服务推荐。
然后整个2023年用户都在问,你们能做行为翻译吗?比如我的狗叫是什么意思,或者它的眼神代表什么?我们也考虑过这个问题,但我一直认为宠物行为翻译,尤其是叫声,并不算一种真正意义上的语言。翻译时只能去匹配人的声音,或者采用类似脑机接口才能真正理解。但后来我去读了很多论文,发现科学界已经在这方面做了非常多的研究。
硅星人:所以这些研究帮助了你们的产品开发。
孙邻家:对,科学家们对蓝鲸和狗的行为研究最深入,我们就基于这些来开发产品。狗的叫声不是语言,要把它翻译出来变成人话就得先做定义语义。但它信息量毕竟不像人类语言那么丰富,所以要结合表情和肢体语言。这样,技术就被逼到一个多模态的方向,需要声音、图片、视频的多种结合。
当我弄清楚这些后,下一步该怎么办?因为我不是大模型出身的,过去13年创业经验都是在做产品和增长。所以要做这个项目,就要到业内最优秀的公司OpenAI挖人。
硅星人:这是你的Co-founder Jason对吗,你们是怎么走到一起的?
孙邻家:我们有共同的朋友介绍,也在一些活动中遇到过。认识了大概10个月吧,经常会吃饭聊天,交流进展和遇到的问题。后来他决定加入我们。
硅星人:他为了你们放弃了OpenAI?
孙邻家:哈哈,其实他离开OpenAI后还在百度美国工作了一年。他有创业的意愿,而且对应用层面很感兴趣。OpenAI内部做了很多应用探索,比如旅游、医疗、教育,但效果不好,所以才大力投其它创业公司。Jason和我一样,觉得AI时代的不确定性是吸引人的地方,比如宠物行为翻译,这需要发掘大模型的能力。
硅星人:你们很有魄力,因为很多人会避开有不确定性的项目。
孙邻家:不确定性可以带来有趣的东西。做有趣的东西才能解决用户需求,用户觉得好玩就会来使用。我们要挑战那些看似不可能的事,成功后大家才会眼前一亮。硅谷不缺工程师,缺的是企业家。如果我们成功了,对华人社区的影响会更大。
硅星人:不久前Traini的“狗语翻译”功能在社交媒体出圈,激起大家的强烈兴趣。你们是如何确保狗语翻译的准确性?
孙邻家:好问题。我们现在的重点是建立专家标准。很多宠物行为专家和科学家知道宠物行为的含义。我们把他们的知识转化为标准和数据,通过大量的数据和图片视频来标注。同时也依赖数据标注后的训练结果,随着数据量的增加,效果会越来越提升。
硅星人:你们还在不断地收集和标注数据,对吧?
孙邻家:是的,团队虽然小但效率很高,尽管融了一些钱还是注重节省。数据采集和标注都是我们自己人肉在搞,虽然慢,但质量更高。我们希望在早期能把基础打好,未来就能走得更稳。
硅星人:你提到行为翻译是多模态的,所以除了上传录音,用户可以用镜头拍摄吗?
孙邻家:我们现在提供狗狗照片的情绪翻译,比如你上传一张照片,系统能告诉你狗狗的环境和体征,一些更复杂的健康诊断和视频功能还在内部训练中。
目前用户提出的主要都是行为相关问题,比如为什么狗狗突然乱叫,精神萎靡,或者为什么不听话。这些问题类似于在线宠物咨询。我们会告诉他们原因,并提供相应的解决方案和训练课程。
硅星人:你觉得Traini和市面上其他宠物类App的差异在哪里?
孙邻家:市面上的宠物应用主要以训练为核心,而训练只是Traini的一部分。作为一个智能共情平台,我们更关注宠物行为和情感交流,这与传统的移动互联网产品有很大不同。产品模式是宠物共情AI加上服务生态,这就是Traini的独特之处。
现在的情况是宠物主单方面输出情感,而宠物的反馈常常不被理解。我们希望通过技术破译宠物的行为和情感,实现更好的双向交流。
硅星人:目前用户体量如何?有没有一些数据或案例分享?
孙邻家:我们增长非常快。过去30天注册用户增长了5.5倍,活跃用户增长了4.41倍。共有超过20万注册用户。让我印象最深的是有一个用户,他朋友家的狗得了癌症。临终前狗狗一直发出类似呜咽的声音,主人特别想知道狗狗在临终前想表达什么,希望能够安抚它。这让我觉得我们做的事情非常有意义。
这不是个例,很多宠物都会有类似的问题。能够帮助到他们,我感到非常开心。
硅星人:很动人的故事。目前你们跟B端的合作是怎样的?
孙邻家:有很多公司在联系我们,比如清华大学的团队,他们想用Traini的API来开发新产品。还有很多资本相关的合作,最近也有非常多投资人找我。
其实从我们发布demo开始,YouTube、小红书和视频号上就忽然火了起来。我头一次知道点赞和评论特别多时,消息提醒会变成一堆小红点。现在每天从早6点到晚11点我都在开会,直接把节奏打乱了。本来我们5月份刚完成一轮融资,没打算再融钱,但现在有很多VC来问,想拿到下一轮的份额。
硅星人:对这次爆火你怎么看?
孙邻家:我觉得我们谈不上爆火,但确实受到了很多关注。我一直保持平常心,因为如果产品不成熟,用户很可能会流失。我更希望逐步增长,而不是快速上涨后又快速下降。所以最重要的是产品要准备好。
其实当初发布狗语翻译demo的目的也是为了测试用户需求。我们想知道大家是否真的需要这个功能,以及当他们看到这个功能时反应如何。这样我们就知道方向了。下一步就是收集数据、标注数据、训练模型、优化结果,最终提供给用户一个很好的体验。
硅星人:我看到有评论问有猫语翻译吗?
孙邻家:现在还没有。
硅星人:这笔融资主要用在哪些方面?
孙邻家:模型训练肯定是一部分,但产品和增长这两件事同样重要。我们主要会在这两方面投入。
硅星人:你提到了解用户需求后,产品会更好。那么接下来一年内你希望这个App是什么样子的?
孙邻家:这个问题跟我们的规划很匹配。到今年Q4也就是年底,我们计划发布1.0版本的语音翻译功能,包含demo中的狗狗叫声翻译。到明年年中会发布视频翻译功能,这个功能可以识别狗的肢体语言和行为,让交互更加丰富。未来我们可能会把这个功能做成实时翻译,像直播一样,甚至可以用于医疗辅助诊断。
硅星人:非常期待。你说过之前大家都在做大模型,现在大家都在挤应用市场。你的观点是什么?
孙邻家:这个现象很容易理解。当出现一个巨大的机会时,大家都容易上头。大势是有帮助的,但这并不意味着你选择大势就一定能成功,关键在于个体差异化。
去年大家都觉得做应用没前途,做大模型才够酷。今年大家又觉得要做应用,大模型太烧钱,成本高回报慢。每个团队都有不同的能力,有些适合做大模型,有些适合做应用。重要的是从自己的擅长点出发,而不是盲目追风口。
我们从2018年就开始关注宠物行业,观察到人口红利的消失、婚育率下降和宠物收养增长等趋势。从2018年到2024年,美国宠物行业的市场规模从910亿美金增长到1500多亿美金。这些都是我们长远而深入的研究和判断的结果,继而选择一个合适的时间点切入。
很多创业者因为找不到方向而焦虑。因为他们常常从风口出发,而不是从自己的擅长点出发。我一直专注于将日常生活中的需求数字化,通过平台展现出来。尽管行业不同,但背后的增长和产品逻辑是一样的。很多人可能看不到背后的这些东西,只看到我从餐饮行业跳到宠物行业,但其实我对大市场的了解和判断是一贯的。作为创业者,你要把自己擅长的点融入产品核心,才能在输出观点时足够自信。
硅星人:这种自信在融资时也很重要。
孙邻家:没错。我的朋友圈也常常在记录这段创业历程中的收获。现在我们有底气对一些合作和投资人say no,因为我们有自己的行业判断。从最初的起点到行为翻译,再到未来的更多应用,我们会一步步走下去。
硅星人:也就是说光有钱是不能吸引你的。
孙邻家:对,我们公司融资的需求特别简单。首先是效率高,不希望投资机构拖延很久。其次是愿景一致。我们希望投资人理解并支持我们的行业和团队。如果符合这两个条件,我们就很高兴合作。
硅星人:你觉得你们的核心竞争力是什么?
孙邻家:核心竞争力最终还是回到人身上。我们团队有4个全职成员。一个负责产品增长,一个负责模型训练,一个负责设计,还有一个负责App的工程开发。各司其职,一直很紧凑。我认为创始团队来说,无论是对产品和场景的理解,还是技术的迭代,快速的纠错和决策能力都非常重要。如果在决策过程中走偏了,可能就掉下悬崖了。
硅星人:现在你怎么看待AI+应用的前景,觉得哪些方向比较有前途?
孙邻家:我认为情感方向和教育方向都有很大的机会。比如陪伴类应用和情感交流。我们公司称之为“AI to X”,其中X可以是宠物、线下服务、情感翻译等。医疗领域也有机会,但需要更多的资源和监管支持。
硅星人:最后,能分享一下创业过程中的一个痛苦时刻和一个快乐时刻吗?
孙邻家:实事求是地说,没有特别痛苦的时刻。我一直是一个谨慎乐观的人,会把事情想到最坏和最好,所以没有特别焦虑的时候。当然,产品被认可和用户反馈是特别有成就感的时刻。另外我们团队有两个全职成员,是在无报酬实习了一年后转正的,他们的认可也让我特别开心。
硅星人:非常感谢你的分享。
孙邻家:谢谢,希望对大家有帮助。
微信扫码关注该文公众号作者