vivo OriginOS 4预览版体验：蓝心大模型进手机，手机变成真·个人助理

2023-11-03 04:11

手机+大模型的答案到底是什么？

很多人畅想过这样的未来：比如拥有大模型技术的端侧智能手机助手，可以帮你直接接电话，回复邮件，甚至回复微信；通过更流畅的自然语言技术，帮你快速总结同事发过来的冗长的汇报方案；所有智能的一切都结合在手机助手上，汇聚你的信息、出行、娱乐，更聪明便捷地规划管理你的行程。

我们过去体验过很多云端的大模型，很多大模型应用都推出了端侧Androd/iOS的APP版本，比如妙鸭相机这样的人工智能大模型应用一度爆火，人们快速感受到了AI进步的理解能力。但手机大模型的体验还是有一定区别，从原理上来说，端侧大模型就是将算力、推理集中在智能手机中，不依赖云端。

这个过程，更像是将大模型变小，重新适配，塞进我们的智能手机的过程。

人们一直好奇，智能手机这样的算力和场景，加上大模型更流畅的自然语言能力能给我们带来哪些体验的改变。

最近，vivo在开发者大会上也带来了全新的OriginOS 4，最重要的改变之一，就是大模型技术代表——蓝心小V将大规模登陆到vivo智能手机上。我们这次也提前收到OriginOS 4的预览版本进行了体验，预计蓝心小V将在OriginOS 4的正式版上线。

端侧大模型来到手机

人们对于大模型技术有一个比较刻板的技术印象——流畅的语音助手。

其实从技术底层原理上看，大模型技术代替的是语音助手工作模块中对语义理解的功能，尽管过去很多智能手机已经内置了语音助手，但大模型技术应用后，可以继续提升它的理解上限，并且提高综合体验——比如逻辑的推导结合能力，以及此前因唤醒和识别错误带来的不便。

vivo全新OriginOS 4集成了⾃研的通⽤⼤模型矩阵——蓝⼼⼤模型。蓝心大模型包含了云和端的概念，从宏观的参数上，蓝⼼⼤模型将包含⼗亿、百亿、千亿三个参数量级，共5款⾃研⼤模型，全⾯覆盖核⼼场景。

10亿模型-⾯向端侧场景打造的专业⽂本⼤模型；70亿模型-⾯向⼿机平台打造的⼤模型，在⾃然对话、知识问答、意图理解等场景下能⼒优秀，即将⾸家开源。700亿模型-⾯向云端服务的主⼒模型，既有智能涌现，也能兼顾成本和性能。在意图识别、⽂案写作等场景下优势明显。1300亿和1750亿模型-应对极限场景下的复杂任务。

而vivo全新OriginOS 4内置的蓝心小V，就基于蓝心大模型开发的全局智能辅助功能，成为用户的专属私人助理。

蓝心小V应该算是Jovi助手的进阶补充。经过简单的系统设置—侧边栏设置—登录vivo的账号，就可以直接使用了。

呼出的方式也很简单，你可以通过侧边栏，或是打开悬浮图标，设置在屏幕的原子组件等直接使用。

蓝心小V会率先以悬浮窗的模式出现，这意味着它会比较方便的在你的作业过程中随时插入进行灵感问答。比如比较简单的场景，我最近在重看汤姆汉克斯的《间谍之桥》，在看电影时想了解二战东西德和苏联的背景，可以随时呼出询问。

当然，这是比较简单的QA问答场景，端侧大模型的能力不应只局限在问答。

其实，熟悉大模型的朋友从上面的参数上也可以看到它的能力。据了解，蓝心小V支持超能语义搜索、超能问答、超能写作、超能创图和超感智慧交互等。

按照我们的理解，翻译成大家可以简单理解的话，就是除去过去的简单的信息整理和查询外，大模型技术支持将这些内容进行再次创作和推导——比如超能写作支持文本润色改写，支持思维导图等结构性文本创作，支持依据图片生成朋友圈文案等。超能创图——大家应该也比较了解，就是支持图片转换风格，支持基于文本生成图片等。

超感智慧交互比较有意思——支持文字、图片、拖拽等交互方式。支持微信识屏可进行快捷文字提取、日程建立等操作。

我们通过一些gif来让大家看得更明白——

从实际体验上，文本润色改写、思维导图等结构性文本创作是我认为比较“有用”的功能，更像是你多了一位私人助理，提供一定的灵感创作，常见于工作场景中，在没有思路的时候，可以让蓝心小V帮你开个头，然后你再进行修改。

超能创图偏“娱乐”性质，可以用来体验文本生图的能力。

也可以理解图片，帮你写个小红书，或是朋友圈文案。

以上都是在强调蓝心大模型的再生成的能力。

另外，端侧大模型的概念，其实一定程度上也是因为网络侧大模型存在一定局限性。比如云端数据和个人隐私之间的数据隔阂在智能手机这类个人终端上就比较明显。

独立空间信息的保护和利用，其实是端侧大模型的价值所在。

超感智慧交互，其实就是这一个概念下的功能。我们都知道微信的聊天内容常见于云端，手机内也充满了应用孤岛，信息不通，一个端侧的大模型其实价值就是在于融合手机内的信息，形成一个独立的闭环体验。

过去应用之间的信息传输建立在授权这样的信息通路上，有了基于大模型技术的超感智慧交互，就能实现一定的信息连通。

比如让蓝心小V搜索特定时间的文件：

搜索过去的图片，也可以直接拖动到微信里，实现跨端执行：

刚刚下载的英文论文，也可以直接翻译简述：

可以继续追问，对英文文件中文导览对话提问，直接生成答案：

一个更贴心的系统

vivo副总裁、vivo AI全球研究院院长周围在发布会上提到，现代计算机强化学习之父理查德·萨顿教授曾在“强化学习”这本书中，将可与环境交互、识别意图，决策并执行，通过奖励机制不断学习和进步的人工智能系统，取名为智能体（agent）。

vivo认为，智能体将出现在各种终端载体中，并拥有各种各样的外在形象。vivo会积极建设智能体的载体框架，打造性能流畅的虚拟引擎，更好的承载智能体。未来，智能体可能是机器人、智能汽车、虚拟助手等等。

流畅好用是一个系统的基础。

OriginOS 4升级了硬核技术：比如异构计算空间、内存融合4.0、系统轻量化等，用于继续提升系统的流畅度。

比如系统轻量化通过改写安卓内核，将系统和三方应用后台轻载化，在保证原有功能不受影响情况下，降低20%的后台负载，大幅降低了系统耗电量，提升系统的性能。对比OriginOS 3，待机提升15%，在用户日常用机状态下待机长达14天。

与此同时，手机作为最贴身的智能设备之一，OriginOS 4在出行、工作、个人等场景进行优化。例如全链路停车助手：提供从找车位到取车缴费的停车全链路服务，让停车体验轻松不焦虑。包括：一站式停车服务、快速缴费、离库导航优化等技术。全链路会议助手：会前将头部会议软件日程同步到系统日历中，开启前智能提醒，免去输出会议号等复杂操作；会议过程中支持双端的语音转文字记录，重要内容随时截图插入，还可支持隐私保护；会议结束后，会议妙记手动保存在原子笔记中随时查看。

在大模型领域，有一个专业领域词汇被叫做“智能涌现”。它是指当训练量超过某个阈值时，模型的精度会突然暴增。一旦解锁这种“涌现能力”，模型就会因量变引起质变，开启“自动驾驶”模式。即使在没有专门训练过的领域，也能涌现出知识理解和逻辑推理能力，这种“智能涌现”是大模型具备人类思维的前提。

当大模型变小，塞进手机，其实小模型也具备了这种手机智能的“涌现”能力。

比如基于大模型技术的语义理解出现突破性的技术进展后，理解视频和理解图像的能力大幅提高，它对智能手机的改造也开始了。

融合知识图谱、逻辑思维和视觉大模型等能力的蓝心小V，可以实现多模态的打通，并且在端侧对用户的个人信息，实时场景融合，最后定制功能和服务。

视障群体们看不到外面的世界，但是他们可以开始通过智能手机了解。

vivo开发者大会上的高潮和泪点——几位视频中的视障群体举起了自己的vivo手机，语音助手奇迹般地描述出了目前周围的场景；他们第一次刷起了微信好友的朋友圈，因为语音助手终于可以全面“理解”手机屏幕上的内容了。

vivo看见就是为了提升视障用户参与世界的广度和深度。包含环境描述、辅助拍摄、图像描述、实时识别、物体查找五大关键能力，解决视障人群关键场景的关键问题。

为了帮助有乐理知识的音乐进阶视障用户“发现乐谱、练习内容，自由探索音乐世界”，OriginOS 4也带来了vivo读谱，它具备乐谱朗读、免费曲库、AI扒谱三大核心能力。

鲜为人知的是，在国产一众智能手机的OS中，vivo其实是一个无障碍领域的潜行者。

今年3月，vivo上线了“手语翻译官”，自此听障人群不仅可以与家人、朋友更顺畅地交流，还能够更方便地点餐、购物等等。语音转文字、文字转语音，文字转手语和手语识别转文字，是实现无障碍沟通的核心技术。

vivo认为，信息无障碍是每个人访问信息时的自由选择和使用权利，他们相信“有爱，无碍”，科技一直都只为让人与人更好地抵达彼此，让每个人都可以拥有更美好的生活。

vivo的一小步

大模型在智能手机行业并不算是特别新鲜的技术词汇，但尽管智能手机行业都冲在“大模型化”的浪潮中，vivo在这次开发者大会上的集中技术和场景展示，给我们描述了一个更清晰的未来的智能手机发展图景。

这一切离不开vivo在AI领域的持续积累。vivo的AI战略起始于2017年，作为最早投入人工智能方向研究的中国手机公司之一，vivo一直持续投入研发至今，并且在芯片、5/6G、系统软件等技术上有持续积累。

将大模型塞进手机，也意味着对于很多普通用户来说，开始彻底拥抱大模型技术，进一步降低人机交互的门槛。

一方面，对用户的日常使用受益良多，另外，也给手机智能的再次进化打开了一点想象空间。

过去，大家调侃智能手机是一个最贴身的数码设备。现在，我们可以叫它是一个真·个人助理。它在数字化你的个人资料，智能化地规划你的出行和行程。在这个过程中，场景体验永远先行，然后，我们可能真的会迎来“智能涌现”的时刻。

点击关注，精彩不错过↓

点个“在看”，再走吧👀

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章