从“80后”到现在,每一代中国人都有一个挥之不去的共同记忆——学英语。上学的时候学英语有多痛苦,成了很多人噩梦般的回忆。但奇怪的是,今天我们已经不怎么强调英语学习的重要性了。社会上关于“取消英语主科”“取消英语高考”的呼声越来越多,官方还得一次次下场辟谣。曾经遍布街头巷尾的各类英语培训机构这些年也倒的倒、散的散。其实中国人从小学英语的记忆,跟中国改革开放以后的发展,跟我们的外交和经贸往来有很大的关系。老一辈的人,比如“50后”,学的第一外语很有可能是俄语。但是自从21世纪初,中国加入WTO以后,“学英语”就跟“学外语”画起了等号。有这么一个规律:谁是我们最大的外交、外贸伙伴,我们就跟谁交流多,学对方语言的动力也足。 但这个规律现在不好使了——因为我们近五六年来最大的两个伙伴,一个是东盟,一个是欧盟。可是东盟10国10种语言,欧盟27国24种官方语言……中国掀起了以“一带一路”为代表的新型全球化浪潮,整个欧亚大陆的联系前所未有地紧密——但是再想用一门外语包打天下已经不太可能了。所以像《流浪地球2》里面就设想吴京和外国人未来都用同传耳机来对话。难道这只能是科幻吗?AI时代,我们能不能借助科技的力量,无障碍地同多语种伙伴沟通交流呢?这次在美国CES(消费电子展)大会上,我看到一个很火热的展位,走过去一看,很多老外不是同一个国家的,却都在用自己的母语互相交流!我就很好奇怎么回事,发现原来他们都在体验同一款设备,看起来是《流浪地球》里吴京“同款”同声传译设备。
两个耳机,一人一只,我张嘴说中文还不到一两秒的时间,对方就已经听到了同声传译出来的内容,支持几十种语言,根本不用等。我能看着对方的眼睛,面对面跟他流畅地交流,不需要看其他任何辅助设备。如果你想看,还有一台彩屏翻译器,可以实时显示对话的双语内容。如果你嫌对方耳朵不卫生(或者对方嫌你的耳机不卫生),没关系,你戴耳机,让他对着翻译器说就行,俩人都不需要掏手机打开什么翻译APP。出门的时候,耳机还可以完美收纳进翻译器里随身携带。这种科技产品形态我确实没见过。而且据他们介绍,两台或多台同声传译器相互碰一碰就会组网,可以支持20个人同时用5种语言说话,还是同声传译,同声吵架都可以。(再也不能对着老外说脏话了……) 更让我感到惊喜的是,这还是一家中国企业,叫时空壶(TimeKettle)。跑遍了整个CES,这个全球最尖端、最新潮的消费电子产品展会,我本想找一家竞品对比一下,一决高下,结果一家都没有找到。再看看这款X1同声传译器,场景上几乎覆盖了所有跨语言沟通所需,而且是全球唯一一款同声传译器,所以不光现场老外喜欢试用、问这问那的,外媒也是纷纷报道。据我了解,同声传译可是翻译领域一个非常神奇的职业。因为他们练出了一种常人难以想象的能力——一边听,一边译。这样的收费标准也意味着,他们提供的服务是我们老百姓难以企及的。大部分人在日常工作、出差、旅游当中碰到外语交流的障碍,根本不奢望自己能得到“同声传译”这样的服务。最简单的翻译需求就是问个路、点个菜、打个车,这种属于信息交换,一般大家都会用翻译app;再难一点,跟外国人谈生意,这时候需要拿一台好点的翻译机,或者就得找专业的翻译人员了,这属于“安全交流”的需求;再往上,其实就是更高级的需求了,比如我想跟外国人建立情感连接(交个朋友、谈个恋爱、娶个媳妇),我想跟外国人几乎没有时差地沟通(同声传译),我想完全融入到一个陌生的异国群体当中等等。而这一次,中国人做出来的这款神奇的“同声传译器”就是为了满足“高级”翻译需求研发出来的。这家叫做“时空壶”的公司,很多人都没听说过,但事实上,他们已经成为中国企业出海的一个杰出代表。在美国亚马逊上,时空壶(Timekettle)的各种翻译耳机产品长期霸榜“电子外语翻译器”品类的TOP1。在Youtube上还能找到很多老外测评时空壶翻译耳机的视频。老外和朋友一起用时空壶产品,发现不再需要盯着手机、翻译机屏幕等翻译结果了,而是可以看着对方的眼睛来交流,这是一种很奇妙的体验。我就很好奇,这家中国公司是怎么想到做这个东西的?他们是怎么在这个细分领域做成第一名的? 这家公司的创始人叫田力,电科大毕业,曾经在华为工作,后来加入了一家与AI机器人相关的创业公司。
2015年前后,田力的父母到欧洲游玩。他怕爸妈出国交流有困难,还特意准备了翻译机。
结果家人在当地身体突发不适,住进了医院,紧急联系当地医生救治,但是翻译机非常难用,尤其是情况紧急的时候,更是让人着急上火。
当时AI领域在国内已经掀起了一波热潮,2016年初,AlphaGo与李世石展开围棋大战,随后微软、百度、阿里等企业推出各类AI智能音响、集成人脸识别技术的支付工具等。
虽然此时语音识别、机器翻译都较为成熟,但还是缺少与普通人的需求链接。田力本身就在做相关工作,经过这件事,他深受触动。2016年他决定创立“时空壶”这家公司,要做出让人人都好用的AI翻译设备。他说:“人们最喜欢的沟通方式是面对面,有眼神和肢体动作交流。时空壶所做的工作就是还原人们正常交流时的状态。”他要为不同语言背景的人群,打造一个沉浸式交流体验的工具。三四个人的团队,从一开始规划的产品形态就与众不同——翻译耳机。没想到这样一个小小的产品,从立项到上市竟然经历了近3年,其间有很多意想不到的坎坷。这款产品还没做出来的时候,他们一方面为了筹措资金,另一方面为了预热宣传,就选择在美国著名的众筹网站Kickstarter上面开启众筹。结果众筹过程中,一些外国用户就反馈,这个耳机只能翻译、不能听歌,功能有点少,大家希望来一款全能的无线蓝牙耳机。由于翻译耳机,它本身体积很小,按当时的元器件集成水平,如果既要听歌,又要翻译,那么翻译上的体验就会很差,最后做出来一个啥功能都不灵光的“四不像”产品。所以田力反复斟酌,做出决定:就算众筹金额会因此受限,就算要靠继续融资来维持研发,也要先打造一款翻译功能好用的无线耳机出来。三四百万人民币的投入,将近3年的时间,在一个无人区里探索——市面上连一个可供参考的竞品都没有。开发同传耳机面临的难题,一是要消除杂音,二是能把语音高质量地传输到翻译终端。普通耳机并不支持多人对话时把多个声音传输到终端,正常对话也不会设定“Siri”类的唤醒语,而且终端翻译准确性取决于传输声音的质量,这就要求配备解决同传过程中的处理杂音、声音唤醒和翻译断句等技术。从第一代产品开始,用户用时空壶就不需要点按、说话、点按结束,或者一直按住手机屏幕上的喇叭按钮,说完再松开,而是可以不间断地用母语和外国人自在交流,同时解放双手。因为时空壶独特的“唤醒算法”是神经网络技术下的一种降噪技术,可以把你的声音从背景声里剥离出来,帮你进行智能的断句,但是又不需要任何的唤醒词。直到2019年初,第一款翻译耳机打磨好以后才上市,让众筹的用户等了足足一年的时间,但上市以后就收获了不错的口碑。随后他们乘胜追击,2019年在Indiegogo上发布全球最小的便携式随身翻译耳机,众筹了约55万美金。ZERO系列耳机在日本众筹超过7000万日元,在中国台湾众筹超过2200万新台币。有了多次众筹收集到的用户反馈,时空壶不断迭代产品,在亚马逊上上架后也很快受到欢迎,2020年,旗下的WT2、ZERO、M2耳机包揽亚马逊美国站细分品类的前三名。田力发现,他们第一站选择海外市场是对的,但让他没想到的是,时空壶翻译产品在美国移民群体,尤其是华人和西班牙语少数裔群体中广受欢迎。外语不好的移民融入海外国家的过程中要经历诸多困难,而时空壶给了他们一个触手可及的解决方案。在海外营销推广上,他们在YouTube、TikTok等视频平台,邀请很多达人推出了多期测评视频,还做了“中国女婿见外国老丈人”“法国美女见异国男友妈妈”的趣味视频。YouTube的特点是,播放量不一定超高,但由于视频内容有深度、有趣味性,付费转化率比较高;而TikTok短视频的特点是,转化率可能比YouTube更低,但是有可能做出爆款视频,形成大范围推广,让更多人认识你的产品。在《2022国内主流AI翻译机实测报告》中,时空壶同传耳机获得实测报告翻译耳机品类第一名,产品销往100多个国家,全球范围内累计用户超30万人。2022年,中国外文局还搞过一次主流AI翻译机实测,让216名获得CATTI[翻译专业资格(水平)考试]二级以上证书的译员和223名其他翻译爱好者参与实测,最终时空壶研发的翻译耳机产品在这次实测中获得了翻译耳机品类第一名。几代翻译耳机、翻译器产品做下来,他们也收到了一些很有意思的用户反馈。因为翻译耳机是一对,正常用法是你一只我一只,但有些用户把其中一只耳机放在电脑扬声器或音箱旁边,自己戴着耳机去听音箱里放出来的声音。但是这样翻译出来的效果是不稳定的,音箱的声音和真人对耳机讲话的声音频谱是不一样的,就好像用手机去翻拍一张冲洗好的照片。一种很自然的想法是不建议用户这样做,但是田力和时空壶团队就反向思考,说明他们既往的产品没有覆盖一种真实的需求:用户希望用母语收看、收听一些外国的视频、音频作品。除此之外,他们还发现一个需求,就是有些公司需要跨国召开多语种的线上/线下会议,需要同时满足多语种翻译成多语种的同传服务,比如中英法德日五国人员同时在场,这其中就可能有中英,中法,英法,法德等20种语言对需要翻译,甚至是同传(翻译延迟很低)。而市面上完全没有任何同传口译员之外的服务能满足这一点。
另外,还有一个很细节的体验,刚才咱们也提了,就是如果我只是跟陌生人聊几分钟,我要不要把一只耳机分享给他?时空壶过去的翻译产品,解决这个问题的方案是把我的手机递给对方,让对方冲手机说话,但这样还是不太方便,也不安全。创业8年以来,时空壶和田力本人一直以来的产品逻辑就是:不是跨语言沟通行业什么竞品卖得好,我们就选什么品,我们就做什么;而是我盯死了一个需求,一个没有任何企业真正满足过的需求——零延迟、无感知的AI同声传译设备,咬定青山不放松,让每一代时空壶的产品无限逼近去满足这个需求。这不是被创造出来的“伪需求”,而是真正回到了人与人渴望打破语言隔阂、自如自在沟通的本源,再用当前最新、最强大的AI技术去实现它。
X1同声传译器这款产品,可以无线连接手机、电脑,在X1屏幕上实时显示对话翻译,同时通过X1配备的同传耳机也能实时听到,对方戴不戴耳机都没问题,也不需要我的手机一直点亮屏幕。
再比如我去参加一个外国专家的学术研讨会,我只需要用翻译器对着话筒方向就可以了,不需要举着另一只耳机/手机来收音。它还可以同时支持20个人用5种语言讲话,0.2秒翻译响应、95%平均准确率,哪怕是开会吵架也能完成同传。X1这款产品是时空壶AI同传技术的集大成者和巅峰之作,同时也是全球能够覆盖几乎所有翻译/同传场景的唯一一款硬件产品。还有一件特别有意思的事情,体现了时空壶团队精益求精的匠人精神:X1本身可以模仿、学习用户的音色。用的越多,翻译出来的声音就越接近你自己的声音。其实翻译的最高境界,是让人们忘记了“在翻译”这回事。时空壶一直不强调自己是做翻译设备的,他们希望自己做的是人和人之间沟通的“连接器”。终有一天,我们要实现的是全球人民跨语种、无感知、0延迟的自然沟通。有人说,我外语不错,我不需要凭借这种硬件设备来跟外国人沟通。但事实上,中国正在面对越来越多语种国家的经贸往来,很多国家的人英语水平都参差不齐,英语国家统治全球化进程的时代已经结束了,“一种语言包打天下”的时代也已经结束了。我们面对的语言和文化环境将越来越复杂,而我们势必要从精通1~2门外语的沉重负担中解脱出来,AI技术加持的同声传译是未来一个必然的大趋势。这不是说从此我们的孩子都可以不学无术,在学外语这件事上彻底躺平。
事实上,时空壶的CEO田力自己就是一个英语不错的人,别人经常问他:因为外语再好,它也不是你的母语。当你用外语跟对方交流的时候,你还是需要高度集中注意力。交流时间一长,甚至可以说是“烧脑”。绝大多数人说外语,永远达不到一个放松、自然、松弛的状态。而这就是时空壶存在的最大意义,这是对“无感知翻译”更深刻的洞察和定义。一切复杂的技术手段,都只是为了让你忘记技术的存在,让你觉得跨文化沟通就像跟家里人说话一样自如、自在。从文曲星词典到翻译软件,到手持翻译机,到翻译耳机,到同声传译器X1,人类的翻译设备越来越呈现出“去产品化”的特点,越来越符合人类的沟通本能,功能也越来越强大。据了解,时空壶正在布局的还有视觉翻译产品,将进一步实现“同传无感”。而让我们特别感到高兴的是,正在AI时代引领翻译/同传设备不断进化的,是我们中国人。在西方的《圣经》当中,原本一大群人只说一种语言。他们在“大洪水”之后从东方来到了示拿地区,决定在这里修建一座城市和一座“能够通天的”高塔。上帝见此情形就把他们的语言打乱,让他们再也不能明白对方的意思,并把他们分散到了世界各地。现在,中国企业正走向全球,为世界人民重新修起这样一座通天的高塔。
首发于微信公众号:酷玩实验室(ID:coollabs)