AI生成「作业答案」,自动剪短视频:华为给新版鸿蒙加了这些黑科技
机器之心报道
在 HDC 大会上,华为公布了很多 AI 技术,其中还有一些是「世界第一」。
有关鸿蒙系统,我们总是有着不一样的期待。
11 月 4 日下午,2022 华为开发者大会在东莞举行。在首日的主题演讲中,华为带来了鸿蒙生态的最新进展,其中包括分布式能力、原子化服务、AI 技术、花瓣地图、音视频、隐私安全等创新技术成果,五大场景下的创新体验及全新开放能力。与此同时,华为还基于声明式开发体系发布了鸿蒙开发套件,其中包括鸿蒙开发语言 ArkTS。
在大会上,华为同时展示了其在计算机视觉、个性化场景推荐、多模态融合感知、知识图谱、自然语言处理等 AI 技术上的发展。其中的一些让我们对未来的手机应用充满了期待。
如今在搜索复杂问题时,我们往往无法直接得到答案。搜索引擎会显示出和关键词有联系的大量词条,但直接回答问题的内容往往需要人们自行整合。WebBrain 是全球首个多语种权威知识检索生成模型,可以把不同语言中的内容整合起来,形成直接可用的答案。
据介绍,这项技术通过检索增强技术 RAG 和自然语言生成技术 NLG 实现了端到端的权威知识的搜索与生成。它首先通过主题相关性的检索技术在千亿网页中精准搜索到用于生成答案的片段,又采用多源信息编码融合技术将检索到的文档融合,形成流畅的文档结构;最后,智能事实核验技术对生成信息进行相关性、权威性、完备性等核验,再以自然语言的方式输出结果。
华为终端 BG 首席运营官何刚表示:「WebBrain 直接形成一篇完整的文档,而且不受语种限制,搜索内容来自多个不同语言,检索结果自动翻译成你所需要的语言。」
这或许将极大地改变我们获取、生产信息的方式,特别是学生写作业的效率。
WebBrain 可以广泛应用于知识洞察助手、搜索问答、辅助阅读等场景中,华为正在往自家的阅读 App 上集成 WebBrain,预计可以在端内实时智能搜索,以一定逻辑结构为用户提供知识,辅助阅读。应用了该技术的阅读助手功能将会在明年上半年上线。
在华为阅读中,工程师们引入了知识图谱技术,通过语义匹配算法可以构建起高精度的人物关系、时间脉络、故事情节、逻辑结构等内容模型,使复杂的文章内容一目了然。这种辅助用户阅读的技术通过数十 AI 模型在百万本小说的上的训练,实现了毫秒级的图谱查询,扫清阅读障碍,能够让用户对内容理解准确度提升 30%。
在计算机视觉能力上,HMS Core 的视频编辑服务通过集成 AI 美学评价引擎,可以自动寻找用户所拍视频中的精彩片段,过滤无效信息,一键生成精华短片。
华为的 AI 美学评价引擎基于超过 10 万的美学评价数据集,积累了 14 亿图像语义训练数据,可以理解百万场景内容,综合光影、色彩、构图等维度,能够捕捉人体动态和其他物体的识别,帮助你快速生成短视频,分享到朋友圈里。
AI 能力也被引入了音频编辑服务中,通过 AI Singer 模型,创作者只需输入一段歌词,系统就可以根据你所选的曲式和音色完成高拟真度的音乐合成,附带媲美真人的虚拟人歌声。华为自研了懂乐理的 AI 生成网络,可以帮助人们在未来自己创作音乐。
基于 AI 能力的意图搜索与虚拟助手小艺结合,让小艺变得更聪明了。现在我们只需要问一下小艺,即可获得一站式的服务建议。AI 可以通过对用户习惯、偏好、设备、事件、地点、任务等数百项标签和特征的融合感知,实现对用户复杂意图的准确理解,并为用户精准推荐相关服务。用户还可以对搜索结果进行挑选,选择需要的服务,并保存成为一个可查阅,可分享的服务指南。
这些技术可以帮助用户在视频剪辑、阅读、资讯浏览、搜索、语音助手等场景中的体验更为便捷,并为开发者开发新应用提供了帮助。对于普通用户来说,我们在鸿蒙系统的手机上,可以做到很多其他手机无法完成的事。
此外,在花瓣地图上,华为推出了 3D 实景地图。华为展示了通过 2500 张照片,仅用 30 分钟快速构建出 5 平方公里超精细数字世界的效果,效率提升 100 倍。现场展示了令人惊艳的实景 3D 版东莞溪流背坡村地图,打开 Petal 出行即可看到。
华为还计划开放 HMS Core 3D Engine 技术,快速实现大场景高精度云端实时渲染,包括实时光追、体积云雾等,仅可以动态呈现全天实时的日照光影变化,还能模拟高真实感的雨雪等天气效果。
在大会的主题演讲中,华为展示了基于 AI 能力的运动健康数字化体验,并公布了科学睡眠、呼吸健康研究、血糖健康研究、女性健康研究等多个领域的最新进展。
为帮助开发者更高效开发应用,华为构建了设计、开发、测试、上架全流程的端到端切换声明式开发系统,并将应用开发套件升级为鸿蒙开发套件,这是 HarmonyOS 确定以声明式开发体系为方向,应用全面鸿蒙化的一个里程碑。
华为终端 BG 软件部总裁龚体表示,2022 年鸿蒙的自研代码量已达 2000 万行。
在开发者关注的工具和能力上,万物互联的设计体系 HarmonyOS Design 为鸿蒙应用开发提供体验一致的高效设计工具,设计资源免费开放,支持开发者快速调用;更简洁高效的开发语言 ArkTS 可以降低开发代码量,使应用开发效率提升 30%。
为了让手机运行效率更为高效,华为在鸿蒙上提出了 ArkCompiler 进行编译运行机制优化,实现了业界首个动态类型语言 AOT 编译模式,可以显著缩短应用启动运行时间,而 ArkUI 渲染机制简化了界面渲染算法,显著提升了应用界面滑动加载速度。华为同时构建了全新的开发模型「Stage」,规范化进程禁止应用随意拉起后台,并实现了逻辑和 UI 分离,进一步提升跨端流转开发效率。
最后,华为发布了 HarmonyOS 3.1 开发者尝鲜版本,SDK 全面升级 ArkTS 声明式应用开发。HarmonyOS 3.1 将支持 1 万 + ArkTS APIs,拥有声明式 UI、应用开发框架、分布式系统服务、多媒体、WEB、通信等多种能力。同时 HarmonyOS 3.1 SDK 兼容 OpenHarmony API 能力,华为将持续投入 OpenHarmony 开源项目共建。
「在大家的共同支持下,我们克服了一个又一个困难和挑战,经过四年的发展,依托鸿蒙更具生命力的底座,鸿蒙生态已经日渐成熟,更包容、更开放、更具创新力,」华为常务董事、终端 BG CEO、智能汽车解决方案 BU CEO 余承东表示。「从去年 2.0 到今年 3.0,华为鸿蒙终端的用户已达到了 3.2 亿,实现了 113% 的增长。第三方厂商覆盖 2.5 亿用户,增长 212%,可以说鸿蒙的生态体系成长起来了。」
目前,鸿蒙已经汇聚了 200 万开发者,2200 多个鸿蒙智联合作伙伴,并提供了 5 万余个 HarmonyOS 原子化服务。与之配套的 HMS 服务框架在全球快速发展,海外 Top 3000 的主流应用已经有 80% 集成了 HMS Core,近 4 万款应用跟随华为的步伐走向全球市场。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者