Redian新闻
>
OpenAI的新模型,要替代5万名转录员,会议纪要再也不会出错了!

OpenAI的新模型,要替代5万名转录员,会议纪要再也不会出错了!

Science/technology

 点击上方“全球风口”关注公众号

转发朋友圈抽取签名书

你好,我是王煜全,这里是王煜全要闻评论。

9月23号,OpenAI发布了一个叫做Whisper的AI模型,向全球开发者开源。Whisper的英文意思就是说悄悄话,顾名思义就是一个语言AI模型。

我们之前跟大家介绍过OpenAI,就是由马斯克等人联合发起,后来被微软以10亿美元收购的人工智能企业。在整个人工智能产业里,Open AI做的事情更偏基础架构一些,也更具有引领者的气质。它最具有代表性的是两个底层技术,每次推出都引发了商业化的浪潮:

一个是自然语言生成工具GPT-3,开发者们要么把GPT-3集成到自己的业务里,比如通信聊天软件MessageBird;要么创业公司直接拿来创业了,比如第三方AI对话服务团队Sapling.ai;

另一个是AI绘画工具DALL-E,开创了文字转绘画艺术创作的热潮。抓住这一波风口的初创公司Stability AI正在冲击10亿美元的估值。

关于每一种AI工具的应用价值,有一个简单好用的判断标准,那就是看它是不是有潜力替代某种人类职业。比如GPT-3具有了处理人类自然语言的能力,替代对象就是人工客服;DALL-E具有快速生成艺术绘画的能力,替代对象是插画师。

OpenAI这一次推出的Whisper,替代职业就是转录员。根据职业咨询网站Zippia的统计,美国有5.1万名转录员,88.7%的转录员是女性。虽然职业地位不像公司白领那么高,但人工成本也不低,一般的转录员时薪是15美元,而高级转录员的时薪达到了25美元。

由于每个行业都有专业词汇需要掌握,转录员还会有各自擅长的细分领域。比如,医学转录员的平均年薪为3.6万美元,法律行业转录员平均在2.6万美元。从事这个行业,不光要理解行业词汇,打字速度也要远远快于常人,需要很多的耐心和认真的训练才能成为合格的转录员。

如果有一种AI工具,同时拥有各行各业的专业知识,还能准确稳定地把采访、博客、对话等语音转录出来,我们就不需要专门培养那么多细分行业领域的转录员了。

从任务本身来看,音频转文字可没有你想象得那么简单。如果说GPT-3的训练数据是海量的文字,那么Whisper要学习的是各种各样的口音甚至方言,每个人说话的节奏、语调也不一样,由于很多转录场景是电话、通讯APP等非正式场合,背景会有噪音,也会偶尔有中断。

这就要求Whisper在GPT-3理解上下文的基础上,要有更强的抗干扰能力、更接近人类的声音识别能力。不过目前来看,OpenAI把这个工具面向所有开发者推出,已经具备商业化条件了。要知道,GPT-3在公布API接口后,9个月时间就出现300款应用。这一次的Whisper会不会再现当初的盛况,我们可以拭目以待了。

在人工智能领域,AI音频研究是文字、图片之后下一个备受关注的前沿,商业化前景很大。字节跳动的AI实验室有一个专门研究AI语音的团队叫火山语音,在今年9月公开了一系列AI音频技术的突破。

比如现在的有声小说APP需要配上音乐,火山语音的AI系统自己就可以理解小说这段情节的情绪,比如是喜悦还是悲伤,然后配上相应情感氛围的音乐。之前普遍的做法是让配乐师先把小说听一遍,然后在后期逐个配乐,和插画师一样,人力成本很高。

如今,越来越多的AI工具走出实验室,提供给开发者为产业和企业服务了。人工智能未来会朝着什么方向去演化呢?

我认为,现在的人工智能发展,就好比移动互联网刚刚起步的时候,整个行业都处在混沌之中,因为没有人能够讲得清楚未来是什么。

2000年中国移动推出了移动梦网,就像一个大超市,上面涌现了一批增值业务提供商。经历了一轮泡沫后,大批服务提供商陆续退出了市场。2008年的3G网络时代,百度、腾讯、360都推出了手机浏览器来抢占移动互联网入口,但那时候依然还没有大规模的、成熟的商业应用。

2012年以后,触摸屏的智能手机开始大规模替代按键手机,硬件基础开始定型,苹果和安卓瓜分了移动APP平台,越来越丰富的音乐、阅读、打车、游戏等APP就开始成长起来了,上面提供的移动支付、网约车、外卖配送等等服务,都是为我们生活真正带来改变的应用。

现在AI工具好比移动互联网发展的初期,很多都是有一定门槛的开发工具,而且面向的领域相对单一,比如AI转录文字、AI音频等等。类似的,移动互联网最早就只有短信、彩信、手机上网(WAP)和小游戏,谁能预见到后来的精彩呢。

未来会有越来越多的应用开始使用人工智能,甚至催生新的商业模式,应用也会越来越丰富,当应用数量足够大的时候就容易平台化,或许会催生出不亚于当年移动互联网的繁荣。我相信,这一波科技的坦克正在逐渐完善,未来就看谁能打出闪电战来。就像基于移动的应用企业字节跳动可以逐渐超越互联网巨头一样,未来的基于人工智能的应用企业也一定会超越字节这样的今天的巨头,成就下一个时代的辉煌。

以上就是今天的内容,更多科技产业的底层思考逻辑,会在科技特训营里分享。欢迎关注全球风口微信号,报名加入!

王煜全要闻评论,我们明天见!

我们还整理了一份2022年英国准独角兽清单清单,辛苦你点下“赞”和“在看”,点击顶部的“进入公众号”,在对话框里发送科技二字,你就会获得这份清单。

清单每天更新,所以请跟上全球风口的节奏;如果想要所有行业清单,扫码加入科技特训营,分分钟就可尽在掌握!

【科技特训营】全新的会员订阅制线上书院模式,全年50次“在线直播课程+私享群互动”,你随时可以加入、我持续保持更新!一起互动,伴随成长!让我们为未来五年做好准备,一起探讨把握机遇,决胜未来!

【回放地址】
长按图片识别二维码报名加入,可观看所有直播和回放。


1. 前哨科技特训营直播课程第二季(2021年)共50讲+,除此之外还有5节加餐+公开课。
2. 每讲承诺为1小时视频内容,实际平均时长为2小时。
3. 每周四晚八点准时直播,会员可无限次观看回放。
4. 新入会员,可以无限次回看之前所有视频课程。
5. 本课程为虚拟内容服务,年费订阅服务制。一经订阅概不退款,请您理解。

左右滑动查看内容规划↓
左右滑动查看更多

课程咨询】
请加“创新地图助手”:
微信:innovationmapSM




微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
汉堡王下周将推出一款全新的迎合万圣节节日气氛的汉堡 Ghost Pepper Whopper谷歌又闹大乌龙!Jeff Dean参与的新模型竟搞错Hinton生日7 Papers & Radios | 扩散模型只用文字PS照片;MIT泊松流生成模型击败扩散模型7部不容错过的「国风动画片」,一定要替娃收藏好了!Science:肝脏转录因子BCL6提高雄性在感染后的生存能力,但也让它们更容易患上脂肪肝Open House预告|远离网红滤镜,1133Hope凭何成为Downtown下一个卷王?亲人即将“归去”,会提前给你这些暗示,不要再骗自己了bāo huā shēng?bō huā shēng?网传吸金瓶向朝鲜学习的内部讲话吃过海发菜,感觉再也不会脱发了转录检查点丨创新性强、受SCI期刊青睐;渐由基础研究转向临床应用,由癌症研究转向更广泛疾病探索(2022)彩票的诱惑Cell子刊:建立人类海马区域神经胶质细胞的转录组学参考图谱27天拍完的经典,现在再也不会有了笑读成语,再也不用死记硬背了,6岁开始学也不晚!赴华:美国赴华核酸检测网页小工具上线,再也不会搞不清楚检测时间啦~《君子喻于义,小人喻于利》移民局电话会议纪要|22年10月19日重磅!澳洲房价遭遇单季最大跌幅!所有首府约降5.3万刀!千禧世代50%没有房产,这些低价区域竟成悉尼人的香饽饽!ZT:锻炼时谨防痉挛JVI I 夏宇尘课题组揭示乙肝病毒核心蛋白不参与cccDNA转录调控“俄军再也不会为缺这少那而感到羞耻了”紧缺岗位!到2025年,要培养20万名这类人才吐了!澳洲KFC员工在后厨舔鸡肉、咬生菜!网友:再也不吃了!浅谈糖尿病人的运动新州11月起执行限塑令,吸管餐具等多种制品被禁用!可降解也不行,这些替代品也不能用!30亿跑赢GPT-3的1750亿,谷歌新模型引热议,然而却把Hinton年龄搞错了​​“会议认为”、“会议指出”和“会议要求”有啥区别?早报 | 美联储会议纪要显示11月和12月或继续加息;百座大城市名单首次公布佩服!学姐2天搞定综述,有了这个神器再也不会被导师锤了!美联储会议纪要显示对持续高通胀的担忧,未来两个月将继续加息
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。