Redian新闻
>
阿里云AI新品「通义听悟」开放公测:自动提取PPT和做笔记,已嵌入多个应用

阿里云AI新品「通义听悟」开放公测:自动提取PPT和做笔记,已嵌入多个应用

公众号新闻

学生和打工人的又一福音来临。


邓咏仪

编辑苏建勋

来源|智能涌现(ID:AIEmergence)

封面来源IC photo

随着AI大模型技术落地,AI应用正如雨后春笋般不断出现。
6月1日,阿里云宣布通义大模型新进展,AI音视频新品“通义听悟”正式上线,并且正式开启公测。
通义听悟是基于阿里云通义千问大模型开发的AI应用,主要针对音视频内容进行转写、检索、摘要和整理,比如用大模型自动做笔记、整理访谈、提取PPT等。
事实上,通义听悟的前身是阿里云内部一个名为“听悟”的产品,主要功能包括实时会议、音频转写功能,“听悟”自2022年年底就开始小范围内测。

通义听悟

不同于传统的实时会议速记转写,如今面向C端提供视频转写服务的应用尚在少数。而如今的通义听悟,则从纯粹的音频转写,延伸到了音视频领域,融合了十多项AI新功能。
阿里云智能CTO周靖人表示,听悟集成了阿里最先进的语音和语言技术,比如,阿里新一代工业级语音识别模型——其识别准确率在多个权威中文数据集上名列第一。融合自研语音语义多模态说话人算法后,听悟能对10人以上说话场景进行角色区分。如今有了通义千问大模型的能力,听悟也能够对上万字的音视频内容进行摘要总结。
在听悟中,用户可以将视频/音频上传,完成录音转写。根据36氪的体验,在音频转写速度上,听悟的处理速度不错——对1-2小时的音频,听悟一般在数分钟内就能转写完毕。
音频转写完毕后,听悟还能够做到中英对照翻译,还能够一键总结会议要点,划分章节、区分不同发言人的观点、整理待办事项等等。
根据阿里云,通义听悟未来还有更多基于大模型的功能上线。比如,对视频中出现的PPT,AI能够基于通义千问大模型做到一键提取,而用户也能向AI助手针对多个音视频内容进行提问、让听悟概括特定段落等等。
值得注意的是,听悟目前针对一些细分场景中提供了不同的部署形态,如浏览器插件。在Chrome安装听悟插件后,听悟在无字幕视频中就可以实时生成双语悬浮字幕。而转写结果可下载为字幕文件,方便新媒体从业者视频后期制作。

通义千问Chrome插件示意图,近期该功能将上线

在会上,阿里云也介绍了几个已经落地的应用场景。
比如,在阿里云盘中,用户可以一键转写云盘中的文件,在云盘内在线播放视频时,能够实时生成字幕。
而钉钉的在线会议模块“钉闪记”,同样集成了听悟。在会议结束后,钉闪记所能够输出的也不再是纯粹的速记,而是包含重点摘要的完整文档,可以有效地提升公司内部工作效率。甚至,在开会时,AI可以代为记录会议、整理要点。
听悟会以个人版和企业版两种形式提供服务,未来一段时间就将在夸克APP、阿里云盘等端口提供服务。据阿里云,听悟企业版当前已在阿里集团内部被广泛使用,帮助减少了大量会议记录和整理的工作。
在定价上,听悟也跟随阿里云近期的大降价策略。在公测期间,用户可领取100小时以上听悟免费转写时长。听悟用户可通过每日登陆、官方微博、微信及各大平台社区领取口令码,用户的福利权益可累积,一年内有效。
从通义听悟的发布可以看出,国内大模型厂商除了在底层大模型上快马加鞭外,应用层也不能落下——AI对音视频转写、内容理解等功能“加buff”,某种程度上也是AI将各种通用能力“再做一遍”。通过这些能力,厂商们覆盖开会、上课、培训、面试等场景,嵌入到不同的软件当中,才能挖掘更大的商业机遇。


36氪旗下AI公众号

👇🏻 真诚推荐你关注 👇🏻

来个“分享、点赞、在看”👇

学生和打工人的又一福音来临

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
宝马MINI再次发文道歉,马斯克称0利润卖车也能赚钱,天猫精灵接入阿里云通义千问,微信可免费听周杰伦,这就是今天的其他大新闻!Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了OpenAI 考虑推出一个应用商店,意欲何为?强过AutoGPT!微软重磅研究提出APO算法,「自动提示」淘汰提示工程师iPad上做笔记的8个建议阿里云智能发布音视频AI通义听悟|首席资讯日报人工智能的“能”与“不能”阿里云大模型发布 “通义千问”开启企业邀测苏炳添起诉网易侵权;阿里云正式推出大语言模型通义千问;京东零售取消事业群制;联合国将官宣印度成人口第一大国丨邦早报窗外的玉兰花阿里云大模型“通义千问”4 月 11 日带来重磅消息抖音与腾讯视频宣布达成合作;阿里云自研大模型“通义千问”官宣邀测;胡润全球白手起家U40富豪榜发布……阿里版 GPT!阿里云大模型“通义千问”官宣内测:申请地址公布对话阿里云CTO周靖人:“通义千问”不是起点也不是终点国内首个开放公测的大模型产品上线,接入通义千问理解与摘要能力 | 新闻阿里通义千问大模型加持,专攻音视频生产力的「听悟」来了嵌入式:听说,嵌入式这个行业未来十年都不会卷?长篇小说《如絮》第一百一十章 夏威夷-2004年 1 迫降阿里云被曝裁员比例达7%,回应称正常操作;比亚迪新品牌曝光,中文名疑为「方程豹」;阿里小红书技术负责人投身大模型创业|雷峰早报黄仁勋拟本月赴华;美国考虑限制对华AI投资;阿里云通义听悟启动公测丨AIGC大事日报多地爆发?10分钟被骗走430万!AI首个应用场景竟是电信诈骗?阿里云大模型上新!AI神器「通义听悟」公测中:长视频一秒总结,还能自动做笔记、翻字幕 | 羊毛可薅澳洲银行走向数字化!自动提款机时代将会终结?如果想提取现金必须提前预约...阿里巴巴所有产品未来将接入「通义千问」,将推企业专属大模型|最前线报税季节忆报税南极游之二:晕船,探险及探险队王坚或将正式回归阿里云,阿里云重整旗鼓|最前线通义千问,再次「激活」阿里云“通义千问”官宣,阿里张勇:未来阿里所有产品都将接入AI大模型张勇发全员信称未来12个月内阿里云分拆上市;腾讯免费开放四件无障碍技术专利;ChatGPT上架App Store……埃森哲Manager分享获2亿点赞!原来,用iPad做笔记的竟是学渣?阿里版ChatGPT「通义千问」邀请测试,我们第一时间试了试当我开始用AI做笔记……微软关玮雅:每个应用程序都可以由 AI 来驱动 | 中国AIGC产业峰会做笔记!小伙想约会华人女孩求帮忙!中国妻子透露“绝招”:真管用!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。