一口气学完《三体 I》,拍张照就能让AI开发应用,这是钉钉「/」的首份开箱评测
科幻电影《银翼杀手》中有一个经典片段:男主角 Rick Deckard 为了追踪目标嫌疑人,需要在屏幕上放大一张照片。但是,他并没有使用鼠标,而是通过自然对话的形式向显示器下达了口头命令。
这个电影上映于 1982 年,距今已经 41 年。在这四十多年的时间里,通过语言控制设备已经逐步变成了现实。起初,机器能够听懂的语言只是简单的「打开电视」「放大声音」…… 如今,这一范围扩大到了各种复杂指令。人们的生活、生产方式都在被 AI 重塑。
过去,如果你想写一篇营销策划,你可能先要阅读冗长的产品材料,把自己手动提炼的要点编辑出来,然后整理成一篇策划案。但如今,这些工作都被一条「/」简化了。
这个「/」来自钉钉。在前段时间的发布会中,我们看到了关于它的现场演示,比如图文创作、摘要提取、应用开发、专属问答机器人…… 覆盖多个行业的多个工作场景,因此很多人也叫它「魔法棒」。
那么,这个「魔法棒」到底好不好用?在拿到钉钉斜杠「/」的邀请码后,机器之心进行了开箱评测。
此次评测的内容包括多个方面,比如文档编辑能力(文生文、文生图、文生表格)、聊天消息摘要、应用开发、问答机器人等。评测的目的在于验证钉钉「魔法棒」的实际使用体验是否符合之前 demo 和现场演示给人的预期,是否真能提高生产环境工作效率。
文档编辑:文字、表格生成游刃有余,图像生成仍需努力
文档是大部分工作者每天都要打交道的内容,涉及文生文、文生图、文生表格等实用方向。
在这部分测评中,考虑到钉钉服务于产业的性质,我们以一个具体的行业场景切入,看看钉钉能不能在实际业务中帮上忙。
假设我们要开一家奶茶店,但起初,我们并不清楚具体的准备过程。于是,我们新建了一个文档。输入「/」,文档界面弹出「向智能助手提问」的魔法棒。
点击这个魔法棒,我们可以看到它的各种用法,包括头脑风暴、写营销策划、职位描述、竞品分析、产品说明、合同等等。
如果你不确定自己的问题属于哪一类,直接在输入框中提问也是可以的。
第一个问题是:开一家奶茶店要做哪些准备工作?单击回车,魔法棒一口气列出了九条准备事项:
不过,这些条目并不详细,于是我们要求魔法棒继续写。可以看出,在续写的内容中,魔法棒补充了很多细节。
对于开店准备阶段的 SWOT 分析、营销方案撰写,魔法棒也能毫不费力地应对。这些内容足以让开店小白对即将要做的事情有一个基本概念。
入门之后,我们尝试用「魔法棒」生成一些实施过程中可能用到的材料,比如表格、宣传画。
首先,我们尝试让「魔法棒」罗列一个设备采购表格。可以看出,它可以自动给出需要采购的设备种类以及需要记录的相关信息(型号、数量、单价、总价等)。如果在生成结束后选择「继续写」,这个表格还可以继续扩展,帮我们进一步打开思路。
接下来,我们尝试生成一张宣传画:
可以看到,在文生图功能中,魔法棒通常会生成四幅图像供我们选择。我们可以选择其中一幅,也可以全选。作为国内首个将文生图落地到应用上的生产力工具,钉钉魔法棒在测试中的表现确实带来了一些惊喜。
不过,在生成的图像中,我们也发现了一些问题,比如某些风格总是生成失败(如水墨画)、图像中包含一些没有意义的文字、无法定制自己想要的文字等等。这会给使用者带来一些麻烦。
所以,总体来看,在文档编辑这类场景中,文生文、文生表格相对来看比较成熟,在提升生产效率方面成效比较显著。但文生图功能尚不稳定,有种「抽卡」的感觉。不过,相比于 Midjouney 等效果更好的文生图 AI 模型,钉钉「魔法棒」的 prompt 可以更简单,结合工作中的高频场景,使用起来也更方便。
聊天摘要:消除了「爬楼痛苦」,但也偶有瑕疵
在工作中,我们可能经常遇到这种场景:一小时没打开工作软件,群里的未读消息就堆积到了「99+」。为了避免错过重要信息,我们往往要花一段时间「爬楼」,从大量消息中筛选有用的、和自己相关的信息。
但现在,我们只需要在聊天框中输入「/」,「魔法棒」就可以自动把上百条信息总结出来。
同样以开奶茶店为例。假设我们在群里聊了一些开店事宜,聊天结束后想把重要信息总结下来。
在最后一个人发言结束后,输入「/」,选择「智能摘要」,魔法棒开始自动整理。
几秒钟后,「魔法棒」给出生成结果:
可以看出,「魔法棒」基本把三个人聊天的要点摘了出来,而且把最后的任务划分整理得非常清楚。
不过,在整理另外两轮的对话时我们也发现了一些问题,比如摘要过于笼统且无法以对话的形式进行修改、内容与发言人不匹配等。
比如在下面这个闲聊的例子中,「并称其为编辑部厨艺第二好的同学」主语应该是二狗。
此外,目前的「智能摘要」功能仅支持 1000 字以内的对话,如果讨论内容比较长,信息会有所损失。不过我们咨询钉钉同学后了解到,还好它选取消息范围的设定是「自后往前」,这也是为了防止实际使用中,由于前列消息占了大头,导致多次生成的效果会重复。这应该是一种工程化上的设计。
所以,总体来看,钉钉「魔法棒」的聊天消息摘要功能无论在闲聊还是工作相关的群聊中都能发挥一定作用,帮群聊成员省去总结、「爬楼」的时间。当然,该功能目前生成的内容也偶有瑕疵。
应用生成:连拖拉拽都不需要的无代码操作,AI 一键开发小程序
在之前介绍钉钉「/」的文章中我们提到过,OpenAI ChatGPT、微软 Copilot 掀起的这场生产力革命有一个突出的特点:让原本只有少数人能掌握并自由运用的前沿技术走到了每个人身边,成为了实实在在的生产力工具。这点在钉钉的「拍照识图搭建应用」功能中体现得非常明显。
假设奶茶店想要创建一个群组成员都可以填的采购表单应用。我们先在纸上把这个表单画了下来,然后给表单拍照、上传,几秒钟后,钉钉「魔法棒」就生成了我们需要的应用。而且「采购时间」等特殊格式的字段会被自动识别出来,匹配方便的填写方式。
这个过程不需要写代码,甚至都不需要进行拖拉拽操作。我们只通过画图,用自然语言描述就生成了应用,整个体验非常丝滑。
此外,增、删、修改选项和字段也可以通过自然语言来完成。
最后,我们把这个应用一键安装到了群里,所有人都可以看到并填写。
不过,在填写过程中,我们发现,有些字段的填写方式可能并不合适,比如采购渠道默认几个特定选项。当我们想要修改时,这些字段改起来也没有那么容易,指令很难描述到位,需要一定的试错成本和学习成本。
当然,这只是一个很简单的测试例子。在实际生产场景中,如果加以改进,这项功能有着广阔的应用前景,比如生成售后工单系统、制造业巡检系统、电商订单管理系统等复杂的行业化应用。这些应用收集到的信息可以通过宜搭接口同步到企业内部的 CRM 等系统中。
问答机器人:准确度高、喂养型 AI,且一口气学完《三体 I》不成问题
在生产场景中,几乎所有的工作都要求工作者具备「快速学习」的能力,问答机器人的出现让这件事变得不再困难,这也是钉钉「魔法棒」demo 中令人眼前一亮的功能。
假设奶茶店想创建一个机器人问答系统,辅助店员学习各种奶茶的制作流程。
我们首先在聊天输入框中输入「/」,然后选择「问答机器人」指令,「魔法棒」就弹出了让我们上传文档的提示。
在测试中,我们上传了一份简单的「奶茶制作指南」,看看效果如何。
在机器人学习完毕后,我们在群里 @它进行互动问答。
基于学习文档的内容,我们问了一些关于某个口味的奶茶的制作问题,机器人几乎都能答对,有时候还会自我发挥,比如提醒我们糖不要放太多,这是学习文档中没有提及的内容。
此外,我们发现,这个已经训练过的机器人还可以吸收更多文档继续训练,以应对我们提出的更多问题。
不过,鉴于这个文档比较简单,可能挖掘不出「魔法棒」的真实潜力,我们换了一篇更加专业的文档,即机器之心之前发布的一篇万字长文,看看「魔法棒」能学到什么。
在文档学习完毕后,我们问了几个问题,比如「解释一下小样本学习」。可以看到,「魔法棒」精确地找到了问题的答案所在。
为了测试钉钉「魔法棒」学习文档长度的上限,我们先后给它输入了《三体 I》(约 20 万字)和《三体全集》(约 90 万字),发现它可以顺利学习《三体 I》,但没办法把《三体》全集一次学习下来。几次测下来我们猜测,钉钉「魔法棒」现阶段可以学习的中文文档长度上限在二十到三十万字左右。
总结
从测评结果来看,钉钉「魔法棒」的使用体验基本符合 4 月份录屏 demo 和现场演示给人的预期,甚至问答机器人、摘要的效果要超出当时的演示。这超出我们的预料,毕竟原以为大家或多或少都会在宣传上夸大自己的能力。它通过自然语言交互和智能生成技术,为各行各业的从业者提供了强大的工作助手。无论是文档编辑、聊天摘要、应用生成还是问答机器人,「魔法棒」都展现出了出色的实用性和提升工作效率的潜力。
总的来讲,整体测评感受是钉钉斜杠已经差不多可上线对客。当然,由于目前仍处在开发阶段,钉钉「魔法棒」的部分功能我们现在还无法体验,比如群摘要自动生成待办。此外,部分已开放的功能在技术和算法上,还存在较大的提升空间,比如文生图的生成效果可能还不太稳定。
这里也要提一下,钉钉「/」底层是对接的阿里云通义千问等大模型,我们从魔法棒的测评中,也发现在过去一个月,通义大模型的能力和生成效果提升了不少。这说明大模型的学习速度挺快,允许它们成长一段时间。
另外,在咨询钉钉内部人士后我们了解到,他们目前正在紧锣密鼓地迭代钉钉「魔法棒」的更多功能和数据层的系统设计,未来将带给大家更多惊喜,让各行各业的从业者都用上这一高效的生产力工具。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者