AI多模态「六边形战士」,原创音乐、1分钟百页PPT、抖音爆款……
2024年AI行业最大的看点是什么?
那一定是多模态AI应用。
大模型发展到今天这个阶段,文本处理已经是各家大模型的必备技能了,对音频、视觉等多模态的理解和应用才是下一个阶段大模型比拼的赛道。
最近,在AIGC的toB市场,大模型的价格战愈演愈烈。看似这场硬仗才刚刚开始,但胜负尚未可知。然而对于C端,产品实用性和需求能否满足才是市场检验AI产品的真正试金石。
Quset Mobile发布的最新2024生成式AI及AIGC应用洞察报告中,小编发现天工AI已经冲到AIGC APP月活跃用户规模统计的第三名!在短短的半年多的时间,月活用户已近千万,一定程度上证明了天工AI 在大模型满足用户需求上做的还是比较到位的。
那在GPT大杀四方的时候,天工AI为什么能吸引这么多用户的青睐呢?在我们的AI交流社群里,正好有位有小伙伴想找到一个对于新媒体运营友好的AI工具。
虽然国内具备多模态能力的大模型产品有不少,但是天工AI是一个以AI搜索为主的多模态全能AI助手,能搞定图文研报生成、PPT生成、音乐生成、漫画视频生成等非常复杂的跨模态任务。
借着这个机会,小编带着大家体验一下天工AI的能力。
先放一个天工AI体验渠道:
电脑端:www.tiangong.cn
手机端:手机应用商店搜索App“天工”,下载安装使用
小程序:搜索【天工AI智能助手】,直接使用
比如,怎么做抖音美妆运营,我们将这个问题直接转抛给天工AI,看看它是怎么一步步解决问题的。
第一步:多模态搜索,1分钟获取背景资料
以做美妆赛道新媒体运营为例,在天工AI官网上,输入“抖音运营美妆类目的最佳打开方式,给我一个完善的研究报告”,选择【增强模式】,开始「搜索」,天工AI几秒中内就能生成详细的研究报告给到我们,足够我们做背景的研究和学习。
此外,如果你仔细观察会发现这份研报并非单纯的文字描述,是图文并茂的,比如我们拆出来看“哪些彩妆品牌适合新手入门”这个章节,它对每一个美妆品牌和产品都给出了正确的参考图片,信息一目了然,可读性非常高。
输出的结果中不只有图文,还有对比表格,比如:当我们想了解香奈儿5号和邂逅香水时,天工AI能直接输出左右对比的表格,视觉体验非常友好。
这个画面大家是不是有点眼熟?没错,这样的表现和谷歌刚刚发布的Gemini demo中的示例如出一辙!
对于C端市场来说,产品的用户体验是非常重要的,而影响用户感知的,是使用过程中的各个细节,比如和Gemini高度相似的图文交织搜索体验,目前这样的体验效果国内只有天工AI做到了。
如果你觉得上述信息过多,还可以直接让它帮忙总结摘要,即刻触发天工AI的多步骤推理能力。巧了,还是和Gemini demo中的示例一模一样,不仅会主动问我需要总结哪方面的内容,同时也支持自定义个性化澄清:
这款辅助推理小卡片真的让人感动。它能主动澄清、询问、响应用户的提问需求,这种体验让我觉得,真正理解用户的搜索引擎出现了,你提问的对面不再是一个冷冰冰的搜索系统,而是可以有温度的私人助理。
第二步:AI写作+AI文档,5分钟搞定脚本创作
当我们尝试使用天工AI的【AI写作】和【AI文档】来快速制作脚本时,整个过程简直高效得令人惊喜!
首先,我们可以利用天工AI强大的文档分析理解能力,一键导入所需的产品信息。然后,它卓越的写作能力就会根据我们的要求,快速生成一个脚本:
我们可以看到,通过天工AI生成的脚本内容丰富、操作感强。只需简单几步操作,就能快速产出一个高质量、完成度极高的脚本,省去绞尽脑汁想创意的时间!而且,脚本的质量远超过了自己动手写的水平,对于运营入门小白非常友好!
同时小编还注意到一个细节,为什么推广5号香水还要提到邂逅香水呢?
有心了!是非常懂得打广告的小天才!
而且从我们提问得到的答案中可以看出,天工AI经过了认真仔细的分析和处理,回答有理有据,一看就是认认真真“读过”资料没有胡说八道的样子!
我还测试了天工AI在没有文档解析时的创作能力,让它生成了一个名为《重生之我是马斯克,我在OpenAI做AGI》的视频脚本:
令人惊讶的是,这个脚本的完成度也非常高,无论是内容的连贯性还是细节的丰富程度,都达到了可以直接拍摄成为TikTok爆款的水平~
第三步:天工AI音乐,5分钟生成专属BGM
天工AI拥有的AI音乐是国内唯一可以免费体验AI音乐生成的产品,这得益于今年4月刚推出的SkyMusic大模型,这个模型是全球首款并达到SOTA效果的AI音乐生成模型。
只需要输入歌名,AI帮你填充歌词,再喂给它一首你想要的风格歌曲,比如《坤坤神曲》,立马生成一首旋律朗朗上口的歌。专辑封面、背景效果都给你一键生成。BGM也不愁了。
当我们需要一首命题的背景音乐来配合你的新媒体时,我们可以试试天工AI的音乐生成功能!
第五步:用AI视频转绘,自己出镜当主角
还最近还有一个特别有趣的功能悄悄上线——「AI视频转绘」智能体。这个功能可以一键将视频转换成动漫风格或迪士尼风格。从生成的视频来看,效果持续稳定,视频播放流畅自然。
重点是,这个功能免费啊家人们!还不冲吗!
用天工AI,我们轻松一站式搞定了抖音运营的核心步骤,整个过程不到20分钟!成品的质量不仅超乎预期,而且还超好。最棒的是,有了AI的帮助,我们能更快、更便捷地创作出更棒的作品,甚至还能让视频动漫化、风格化,创造出需要但之前不存在的配乐。
这才是真正发挥了AI的力量~ 通过天工AI,我们不仅节省了花费时间,还提升了创作的自由度和质量,实现了以前难以做到的事情。
第六步:用AI ppt,3分钟生成PPT直接做分享
这时候,小编注意到网站侧边栏有一个叫“AI PPT”的按钮。
如果让它把上面几千字的报告做成一份PPT,我岂不是都可以直接去卖课了?!(虽然自己还没学会!但是已经会用它赚钱了)
说干就干!我直接把报告内容粘贴进去,输入指令“帮我做一份抖音美妆博主运营的PPT”。首先,天工AI展示了PPT的文本概要,然后点击“生成PPT”,它立刻就帮我制作出了一份完整的PPT:
看看这效果,目录清晰、图文并茂,都不需要配图了,我愿称之为“PPT大师”!更棒的是,可以选择以PDF或PPTX格式下载,直接免费导出一份现成的PPT。
至此,仅用半小时就完成了从一个简单的需求“了解抖音美妆博主运营知识”到制作出一份详尽的研究报告,再到一份精美的PPT的全过程。如果没有天工AI,这些工作需要至少一周以上的时间。
通过整个过程可以切实的感受到天工AI强悍的多模态能力,无论是撰写研究报告、创作AI音乐、制作AI视频,还是图文生成,它都能轻松应对,它都能轻松拿捏~
通过这一系列体验,小编可以明确感觉到,支撑天工AI这样强大产品力的背后,一定有不容小觑的技术能力支撑!于是,我便顺势扒了一下天工AI背后的大模型——天工3.0。
超级应用背后的「天工3.0」
「天工3.0」是上个月昆仑万维刚发布并开源不久的最新基座大模型,基于自研技术,采用了和GPT-4相同的MoE架构,参数高达4千亿,是全球模型参数最大、性能最强的MoE模型之一。更重要的是,天工3.0是一款功能强大的多模态大模型,不仅擅长基础的文本处理,还在多模态处理如AI图片生成、AI音乐制作、AI动漫创作等方面表现出色。目前来看,国内还没有其他任何一款面向C端市场能将这么多模型功能集成在一起。
无论你想做点什么事,在天工AI 都能找到帮的上你的工具~ 总之,由于篇幅所限,小编在天工AI上发现的很多好玩的应用都没来得及分享,包括音乐生成、表格生成、以及各种智能体等,感兴趣的小伙伴点击【阅读原文】直接上手体验下吧~
微信扫码关注该文公众号作者