AI多模态「六边形战士」，原创音乐、1分钟百页PPT、抖音爆款……

2024-05-25 10:05

2024年AI行业最大的看点是什么？

那一定是多模态AI应用。

大模型发展到今天这个阶段，文本处理已经是各家大模型的必备技能了，对音频、视觉等多模态的理解和应用才是下一个阶段大模型比拼的赛道。

最近，在AIGC的toB市场，大模型的价格战愈演愈烈。看似这场硬仗才刚刚开始，但胜负尚未可知。然而对于C端，产品实用性和需求能否满足才是市场检验AI产品的真正试金石。

Quset Mobile发布的最新2024生成式AI及AIGC应用洞察报告中，小编发现天工AI已经冲到AIGC APP月活跃用户规模统计的第三名！在短短的半年多的时间，月活用户已近千万，一定程度上证明了天工AI 在大模型满足用户需求上做的还是比较到位的。

那在GPT大杀四方的时候，天工AI为什么能吸引这么多用户的青睐呢？在我们的AI交流社群里，正好有位有小伙伴想找到一个对于新媒体运营友好的AI工具。

虽然国内具备多模态能力的大模型产品有不少，但是天工AI是一个以AI搜索为主的多模态全能AI助手，能搞定图文研报生成、PPT生成、音乐生成、漫画视频生成等非常复杂的跨模态任务。

借着这个机会，小编带着大家体验一下天工AI的能力。

先放一个天工AI体验渠道：

电脑端：www.tiangong.cn
手机端：手机应用商店搜索App“天工”，下载安装使用
小程序：搜索【天工AI智能助手】，直接使用

比如，怎么做抖音美妆运营，我们将这个问题直接转抛给天工AI，看看它是怎么一步步解决问题的。

第一步：多模态搜索，1分钟获取背景资料

以做美妆赛道新媒体运营为例，在天工AI官网上，输入“抖音运营美妆类目的最佳打开方式，给我一个完善的研究报告”，选择【增强模式】，开始「搜索」，天工AI几秒中内就能生成详细的研究报告给到我们，足够我们做背景的研究和学习。

此外，如果你仔细观察会发现这份研报并非单纯的文字描述，是图文并茂的，比如我们拆出来看“哪些彩妆品牌适合新手入门”这个章节，它对每一个美妆品牌和产品都给出了正确的参考图片，信息一目了然，可读性非常高。

输出的结果中不只有图文，还有对比表格，比如：当我们想了解香奈儿5号和邂逅香水时，天工AI能直接输出左右对比的表格，视觉体验非常友好。

这个画面大家是不是有点眼熟？没错，这样的表现和谷歌刚刚发布的Gemini demo中的示例如出一辙！

对于C端市场来说，产品的用户体验是非常重要的，而影响用户感知的，是使用过程中的各个细节，比如和Gemini高度相似的图文交织搜索体验，目前这样的体验效果国内只有天工AI做到了。

如果你觉得上述信息过多，还可以直接让它帮忙总结摘要，即刻触发天工AI的多步骤推理能力。巧了，还是和Gemini demo中的示例一模一样，不仅会主动问我需要总结哪方面的内容，同时也支持自定义个性化澄清：

这款辅助推理小卡片真的让人感动。它能主动澄清、询问、响应用户的提问需求，这种体验让我觉得，真正理解用户的搜索引擎出现了，你提问的对面不再是一个冷冰冰的搜索系统，而是可以有温度的私人助理。

第二步：AI写作+AI文档，5分钟搞定脚本创作

当我们尝试使用天工AI的【AI写作】和【AI文档】来快速制作脚本时，整个过程简直高效得令人惊喜！

首先，我们可以利用天工AI强大的文档分析理解能力，一键导入所需的产品信息。然后，它卓越的写作能力就会根据我们的要求，快速生成一个脚本：

我们可以看到，通过天工AI生成的脚本内容丰富、操作感强。只需简单几步操作，就能快速产出一个高质量、完成度极高的脚本，省去绞尽脑汁想创意的时间！而且，脚本的质量远超过了自己动手写的水平，对于运营入门小白非常友好！

同时小编还注意到一个细节，为什么推广5号香水还要提到邂逅香水呢？

有心了！是非常懂得打广告的小天才！

而且从我们提问得到的答案中可以看出，天工AI经过了认真仔细的分析和处理，回答有理有据，一看就是认认真真“读过”资料没有胡说八道的样子！

我还测试了天工AI在没有文档解析时的创作能力，让它生成了一个名为《重生之我是马斯克，我在OpenAI做AGI》的视频脚本：

令人惊讶的是，这个脚本的完成度也非常高，无论是内容的连贯性还是细节的丰富程度，都达到了可以直接拍摄成为TikTok爆款的水平～

第三步：天工AI音乐，5分钟生成专属BGM

天工AI拥有的AI音乐是国内唯一可以免费体验AI音乐生成的产品，这得益于今年4月刚推出的SkyMusic大模型，这个模型是全球首款并达到SOTA效果的AI音乐生成模型。

只需要输入歌名，AI帮你填充歌词，再喂给它一首你想要的风格歌曲，比如《坤坤神曲》，立马生成一首旋律朗朗上口的歌。专辑封面、背景效果都给你一键生成。BGM也不愁了。

当我们需要一首命题的背景音乐来配合你的新媒体时，我们可以试试天工AI的音乐生成功能！

配乐的难题天工AI也完美解决！

第五步：用AI视频转绘，自己出镜当主角

还最近还有一个特别有趣的功能悄悄上线——「AI视频转绘」智能体。这个功能可以一键将视频转换成动漫风格或迪士尼风格。从生成的视频来看，效果持续稳定，视频播放流畅自然。

重点是，这个功能免费啊家人们！还不冲吗！

用天工AI，我们轻松一站式搞定了抖音运营的核心步骤，整个过程不到20分钟！成品的质量不仅超乎预期，而且还超好。最棒的是，有了AI的帮助，我们能更快、更便捷地创作出更棒的作品，甚至还能让视频动漫化、风格化，创造出需要但之前不存在的配乐。

这才是真正发挥了AI的力量～通过天工AI，我们不仅节省了花费时间，还提升了创作的自由度和质量，实现了以前难以做到的事情。

第六步：用AI ppt，3分钟生成PPT直接做分享

这时候，小编注意到网站侧边栏有一个叫“AI PPT”的按钮。

如果让它把上面几千字的报告做成一份PPT，我岂不是都可以直接去卖课了？！（虽然自己还没学会！但是已经会用它赚钱了）

说干就干！我直接把报告内容粘贴进去，输入指令“帮我做一份抖音美妆博主运营的PPT”。首先，天工AI展示了PPT的文本概要，然后点击“生成PPT”，它立刻就帮我制作出了一份完整的PPT：

看看这效果，目录清晰、图文并茂，都不需要配图了，我愿称之为“PPT大师”！更棒的是，可以选择以PDF或PPTX格式下载，直接免费导出一份现成的PPT。

至此，仅用半小时就完成了从一个简单的需求“了解抖音美妆博主运营知识”到制作出一份详尽的研究报告，再到一份精美的PPT的全过程。如果没有天工AI，这些工作需要至少一周以上的时间。

通过整个过程可以切实的感受到天工AI强悍的多模态能力，无论是撰写研究报告、创作AI音乐、制作AI视频，还是图文生成，它都能轻松应对，它都能轻松拿捏～

通过这一系列体验，小编可以明确感觉到，支撑天工AI这样强大产品力的背后，一定有不容小觑的技术能力支撑！于是，我便顺势扒了一下天工AI背后的大模型——天工3.0。

超级应用背后的「天工3.0」

「天工3.0」是上个月昆仑万维刚发布并开源不久的最新基座大模型，基于自研技术，采用了和GPT-4相同的MoE架构，参数高达4千亿，是全球模型参数最大、性能最强的MoE模型之一。更重要的是，天工3.0是一款功能强大的多模态大模型，不仅擅长基础的文本处理，还在多模态处理如AI图片生成、AI音乐制作、AI动漫创作等方面表现出色。目前来看，国内还没有其他任何一款面向C端市场能将这么多模型功能集成在一起。

无论你想做点什么事，在天工AI 都能找到帮的上你的工具～总之，由于篇幅所限，小编在天工AI上发现的很多好玩的应用都没来得及分享，包括音乐生成、表格生成、以及各种智能体等，感兴趣的小伙伴点击【阅读原文】直接上手体验下吧~

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章