大厂来了个聋人老师
如果一个人听不见声音,他将遭遇什么?有可能错失正常工作和社交的机会,也可能因为听不见喇叭声、警报声而陷入危险。声音的缺失,对生活造成的影响犹如连锁反应,激荡的涟漪不知在何处停止。
在中国,被遗忘在无声世界的听障人士有近3000万人。一群大厂的研发人员看到了在夹缝中求生的他们,试图通过技术革新创造听障人士的“第二双耳朵”,帮助他们追赶正常社会的步伐。研发过程不易,每一次技术难点的攻克都需要换位感受听障人士的处境,这是一趟发现“隐形人”的旅程。
大厂的手语老师
李楠没想到,听力障碍有一天会成为自己入职大厂的“敲门砖”。
这天,李楠看到一则奇怪的招聘信息,一家大厂竟然在招聘手语老师。他感到好奇,鼓足勇气投出了简历。
李楠是一位先天性听障人士,手语熟练,平时主要依靠助听器和别人交流,还需要通过读唇语来辅助理解。而遇到就医、办理银行业务等沟通难度较大的事情时,则要借助语音文字互转的软件。
接到面试邀约,想到大厂员工多是高学历的健听人,李楠有些忐忑。面试当天,HR将他领进一间独立会议室,面试官摘下口罩,主动和他打招呼。初步的寒暄过后,李楠听到他问,平时如何跟人交流?李楠回答:“日常场合我没问题,要是去银行、医院的话,还要依靠录音软件,把话录下来,再转译成文字。”
对方又问,软件的体验如何?李楠笑笑:“有文字总比没有强。”
安静的空间内,和人面对面,李楠能用口语实现交流,只是发音与常人稍有不同,有些含糊和吞音。虽然费劲,但他想给面试官留下好印象。没想到,对方主动打起手语,尝试跟他用手语交流,这让他感到一丝惊喜。
李楠的第一份工作也和手语有关。大学毕业后,他误打误撞做起了手语翻译。工作不久后,李楠却挫败地发现,自己始终没办法去大型会议现场。在这样嘈杂的场合,即使戴上助听器,他也无法顺利捕捉到所有信息,更别提做出翻译了。
长久以来,李楠一直期望得到一份工作,能让他完全融入职场环境。但这对有听力障碍的他来说,似乎有些遥不可及。
没想到,这次面试异常成功。没过几天,李楠就收到了录用通知,一脚踏进大厂。手语技能,正是他被相中的理由。
雀跃的李楠未曾想到,他的加入,也是这家大厂期盼已久的及时雨。对这里的信息无障碍团队来说,一位会手语的听障人的到来,将为他们了解这类人群打开方便之门,消除手语技术研发过程中的诸多盲区。
图 | 团队的手语学习教材
得知团队来了一位手语老师,大家都很兴奋,尤其是李小龙。他是手语合成团队的一名AI架构工程师,在遇到李楠之前,他从未接触过听障人士,因为不懂手语,研发工作刚启动就遇到了困难。
李楠的第一堂手语课,在深圳公司的一间会议室进行。“初次见面,多多关照。”李楠比划着双手,略显拘谨。怕大家没有看清,他再次举起手,缓慢地重复了一遍刚才的动作。同事们觉得新奇,也调动手指跟着模仿。见大家响应,李楠不禁长舒一口气,将两只手平放在胸前,手心向上,分别上下晃动。他说,这是“高兴”的意思,他感到很高兴。
学习手语,是信息无障碍团队的一次集体尝试。为了更好地研发手语技术,团队成员需要通过各种渠道学习手语,甚至将手语应用到日常生活中,以便更真切地体验听障人群的需求。
李小龙学会的第一句手语是“很高兴认识你”。他先学着打“高兴”,再学“认识”、“你”,最后把3个手势组合起来。第一次用手语表达出完整的句子,李小龙很激动,“感觉掌握了另外一种语言,或者说一种跟别人沟通的新秘诀。”
手语是一种视觉语言,更直观、形象、简洁。比如,用双手食指搭成“人”字形,代表“人”的意思。手语通常只表达关键词,多余的虚词会被省略,在日常的人际交往中往往显得生硬,容易被误解成“不懂人情世故”。一位网络博主就曾发帖指责听障外卖员态度恶劣,因为对方在短信中写道:给我钱27。实际上,这不过是延续了他们日常的表达习惯。
手语也有不同方言,相似的动作表达的含义也不尽相同。“手指动作有一点点偏差,表达的意思就会大相径庭。”
图 | “我爱你”的手语
对信息无障碍团队来说,李楠不仅是他们的手语老师,更是他们了解听障人士日常处境的一扇窗口。李楠也很愿意与同事们分享生活中的细节,期待自己参与的产品能真正解决听障人群的困境。
相较于其它沟通能力有限的听障人士,李楠在生活上遇到的困难不算显著,但听力缺陷仍给他带来不少“隐痛”。比如去医院时,如果没有健听朋友的陪同,他只能用纸笔费力地与医生交流,这样效率无疑很低,他只好把医生的话录下来,回去后再请人帮忙分辨。而接收快递和外卖时,常人一两句话就可以说明白的信息,他需要耗费一两分钟才能说清。
现在,李楠全身心投入到信息无障碍项目中,期待帮助千千万万像他一样陷入“隐痛”的无声人士,有朝一日能够真正融入有声的世界。
创造第二双耳朵
当李楠所在的深圳团队忙着手语识别项目时,杭州办公室内,负责“vivo听说”的团队也在进行产品的升级改造。
产品经理胡金乐的桌子上,总是放着一副降噪耳塞,以便实时模拟听障人群的生活环境。自从参与这份工作,他总是习惯性地观察听障人群的生活细节,仿佛大脑后台有个程序在不间断地运作。
图 | 胡金乐工位上的耳塞
这天乘坐地铁,他无意中看见几个打手语的人像鼹鼠一样挤在一起,而不是像普通人一样保持一定的社交距离。他想,为什么要靠得这么近呢?忽地他心里一惊,“可能是出于一种不安全感”。
换位思考听障人士的感受,在胡金乐的日常工作中变得越来越关键,这决定了他是否能做出真正好用的产品。
胡金乐加入时,团队已经开发出这款支持实时文字转语音、文字播报等功能的APP。他要做的,是让产品向着真正满足听障用户需求的方向进一步优化。作为一位00后,胡金乐如同“一张白纸”,总能跳出固有的思维模式,发现被隐藏的问题。
2021年12月,一场“无声发布会”在深圳举办。这是“声声有息公益计划”的启动仪式,地点在一家面包店,店里的服务员都是听障人士。
活动现场,一位参与者尝试用手机点单。他点击“vivo听说”的小耳朵图标,手机持续收音。屏幕上,他的话快速转译成文字,“我要一杯,你好打包,美式咖啡,请慢走,一个面包,有糖吗?不加奶油。”服务员看到后,紧锁眉头,摇摇头表示看不懂。事后,该参与者向产品团队反馈,由于店内环境嘈杂,各种声音全被收录和转译,对方一时无法辨别真正的点单需求。
这一反馈,让团队陷入了思考,大家回到会议室讨论解决方案。会上,胡金乐提议添加标注功能,一句话点击标注后会被标蓝。“像看一本书时用笔画线,方便一眼能看到重点。”这一建议得到了同事们的认可,胡金乐大受鼓舞。
然而,产品的开发并不是总一帆风顺。面对听障人士的处境,健听人士很难做到真正设身处地地共情,这也是问题所在。
一次,胡金乐去超市购物,付款台前站着一位听障客人,正在询问一件物品的价格,他用手机编辑好文字,递给营业员看。营业员先是愣了一下,然后才探身去看手机。回到家,这一画面反复在胡金乐脑袋里浮现,他恍然大悟,“一个陌生人突然向人展示自己的手机,别人肯定会有困惑,心想你这是在干嘛?”
怎样才能使双方都不尴尬?胡金乐灵机一动,想到在产品中添加悬浮气泡功能。“类似于一个气泡,隐藏在界面内,双击气泡,文字内容会放大,还能用语音播报。”
“vivo听说(通用版)”支持主流手机品牌安卓10及以上版本下载使用
有了这个想法,胡金乐迫不及待地分享给第一任产品经理。对方不置可否,提醒他再认真想想,“真的需要用语音播报出来么?”
讨论一番后,胡金乐才发现自己忽略了关键。听障人士的手机总是处于静音状态,一方面是由于自己听不到,不需要开外放;另一方面是为了避免制造杂音,影响到他人。对听障人士而言,异样的眼光往往是产生压力的源头,他们不希望得到外界“特殊”的关注与对待。
回到产品研讨会上,经过讨论,胡金乐的想法被进一步优化——与其播报语音,不如开发双击放大气泡、翻转文字的功能,用户将手机前倾时,可以使对方直接面对屏幕,看到颠倒后的文字,方便阅读信息。
这件事带给胡金乐很大的启发,“做产品不能想当然。”他在心里默默地划下红线,提醒自己时刻保持对听障人群更深入地理解和共情。
当声音可以被看见
过去一年,信息无障碍团队持续研发并完善了“声音识别”、“无障碍通话”、“vivo听说”等功能。在此基础上,他们还有更高的追求——让声音被看见。
手语是听障群体最常用的交流方式。如果声音可以被看见,听障人士跟健听人士之间的鸿沟将被大大缩小。李小龙和李楠分别所在的手语合成和手语识别团队,正在着手研发手语与文字、语音间互译的功能,将这种理想变成现实。
想象一个画面,屏幕一分为二。左侧进行手语合成,对着虚拟人说话,语音即被翻译成手语。右侧进行手语识别,类似于自拍画面,对着镜头打手语,手语便会被翻译成语音播报出来。每次互译,中缝都有文字浮现。
采集手语是开发手语合成技术的第一步,李小龙打了个形象的比方,“相当于教程序学单词,网上的单词卡有限,需要人为采集并制作更多的单词卡。”
手语采集不是一件容易的事,它需要通过手部骨骼点精确到每一个指关节的方向和运动轨迹。并且,手语打法多样,动作难以分割,还需要结合表情及上下文体会,复杂程度也更高。
要实现如此精细的技术突破,如同翻越一座高峰。
完成手语采集后,更难的是让算法具备串联“单词”的能力。既要快速准确地将“说话的语序”翻译成“手语的语序”,翻译完成后,还得由虚拟人将手语流畅地打出来——手语词汇的采集是单个进行的,如何让割裂的词汇形成连贯的句子,需要团队逐点攻克。并且,生活中打手语会配合口型和表情,虚拟人的表现同样需要做到生动自然。
以上环节,出现任何停顿都会影响沟通体验,如同电影画面出现卡壳。
图 | 李小龙和团队在调试产品
为此,李小龙和团队开始“争分夺秒”地改造产品。办公室里,经常出现团队深夜加班的身影,第二天彼此照面,个个眼圈发黑。在团队的反复调试下,手语合成画面的反应速度从1.4秒缩短至0.7秒。
手语识别及合成技术有了雏形后,为使效果更精准自然,还需要额外进行大量的人工测试。李楠再次投入到互译效果的校验中来。为了搜集更多建议,他还邀请自己的听障朋友们来体验产品。朋友们都大为惊奇,这种能够双向交互的手语产品,他们还是第一次见。
如今,vivo手语识别技术作为手机行业首发,填补了行业的空白领域,目前已能支持识别1200个手语词汇,准确率达80%,帮助听障用户实现基础的日常沟通。手语合成技术也已经覆盖国家通用词典8000+的词汇,实现了文字到手语的顺畅翻译,让听障人士与外界的沟通更为便捷、高效。
被听见的意义
在研发工作进行的过程中,团队成员逐渐意识到,听障人群最大的困境,是很难被真正看见、听见。发声困难导致他们与社会渐行渐远,成为被忽视的沉默群体。
生活中,听障人士因为沟通问题,难以识别重要的信息。例如,走在马路上听不见喇叭声,可能陷入危险;工作中,因为没有敏锐的听力而丧失机会,甚至因误解而与他人发生冲突。相比正常人的世界,他们的生活犹如一场黑白默片。
为了更好地贴近用户、体验产品,胡金乐曾在杭州和深圳,组织过一次“无声的爱”剧本杀活动。参与游戏的玩家都是信息无障碍团队的同事,其中一些人需要在剧本杀中扮演听障角色,用“vivo听说”完成对话。
剧情中,小丽将男友带回家,告诉父母他们想年底结婚。一阵寒暄后,父母吃惊地发现,小丽的男友是个听障人士。这引起父母的强烈反对,“你要和他结婚,就别认我这个妈!”冲突进行到高潮,扮演小丽的同事因愤怒涨得满脸通红,扮演母亲的同事则突然鼻头发酸,眼泪夺眶而出。
图 | “无声的爱”剧本杀现场
这是胡金乐没有预料到的效果。他曾一度担心同事们会感到尴尬,没想到大家完全沉浸在了情境中。游戏结束后,一位扮演听障角色的同事坦言,“交流太难了,尤其是插不上话时,心里很着急。”另一位同事则感叹:“不应该因为听障人是少数群体,就要他们适应健全人的交流规则,社会需要更多善意和包容。”
越来越多的回声,让胡金乐越发坚定自己的信念。一次,他整理信息后台,看到一条来自听障用户的留言。对方写道:“你们能考虑到我们这样特殊的群体,设计了这样好的产品。很感谢。”那一刻,胡金乐百感交集,眼眶一下红了。
参与过无障碍功能研发的成员,都深切地感受到自身发生的变化。以前大家很少发现身边有听障人士,如今走在路上,发现他们都“冒了出来”。李小龙觉得,这很像妻子告诉他的“孕妇效应”,当一个人怀孕后,就更容易发现孕妇。
在一场婚礼上,手语识别技术被一位听障父亲使用,帮助他在婚礼现场表达对女儿的祝福。看完这支短片,李小龙热泪盈眶。作为一个两岁女儿的父亲,他感同身受,“他们有很多想说但说不出来的话,我们能做的,就是帮他们表达出来。”
科技产品进行信息无障碍研发的背后,呈现出一个长期被忽略的现实——“隐形”的听障人士需要被看见。
让万物可以被看见、被听见、被理解,用手机架起无声世界通往外界的桥梁,是vivo信息无障碍团队不变的初心。通过功能研发与体验优化,让科技创新惠及每一个人,让那些世界被按下静音键的“隐形人”也能感受到生活的美好,同等地享受科技带来的便利。
工作至今,李楠能感受到,科技的温度,正一点点温暖着自己的生活。在无障碍功能的辅助下,外出办事变得更加从容和顺畅;参与研发的功能即将上线,将帮助更多听障人士走出孤岛,而他也在这个过程中交到了很多新朋友。
这天下班,同事用手语熟练地向李楠发出邀请:“一起去吃饭?”李楠比了一个“OK”的手势,和同事肩并肩走向了电梯。
- END -
往期回顾
微信扫码关注该文公众号作者