Redian新闻
>
AI多模态「六边形战士」,原创音乐、1分钟百页PPT、抖音爆款……

AI多模态「六边形战士」,原创音乐、1分钟百页PPT、抖音爆款……

公众号新闻

2024年AI行业最大的看点是什么? 

那一定是多模态AI应用。

大模型发展到今天这个阶段,文本处理已经是各家大模型的必备技能了,对音频、视觉等多模态的理解和应用才是下一个阶段大模型比拼的赛道。

最近,在AIGC的toB市场,大模型的价格战愈演愈烈。看似这场硬仗才刚刚开始,但胜负尚未可知。然而对于C端,产品实用性和需求能否满足才是市场检验AI产品的真正试金石。

Quset Mobile发布的最新2024生成式AI及AIGC应用洞察报告中,小编发现天工AI已经冲到AIGC APP月活跃用户规模统计的第三名!在短短的半年多的时间,月活用户已近千万,一定程度上证明了天工AI 在大模型满足用户需求上做的还是比较到位的。

那在GPT大杀四方的时候,天工AI为什么能吸引这么多用户的青睐呢?在我们的AI交流社群里,正好有位有小伙伴想找到一个对于新媒体运营友好的AI工具。

虽然国内具备多模态能力的大模型产品有不少,但是天工AI是一个以AI搜索为主的多模态全能AI助手,能搞定图文研报生成、PPT生成、音乐生成、漫画视频生成等非常复杂的跨模态任务。

借着这个机会,小编带着大家体验一下天工AI的能力。

先放一个天工AI体验渠道:

电脑端:www.tiangong.cn
手机端:手机应用商店搜索App“天工”,下载安装使用
小程序:搜索【天工AI智能助手】,直接使用

比如,怎么做抖音美妆运营,我们将这个问题直接转抛给天工AI,看看它是怎么一步步解决问题的。

第一步:多模态搜索,1分钟获取背景资料

以做美妆赛道新媒体运营为例,在天工AI官网上,输入“抖音运营美妆类目的最佳打开方式,给我一个完善的研究报告”,选择【增强模式】,开始「搜索」,天工AI几秒中内就能生成详细的研究报告给到我们,足够我们做背景的研究和学习。

此外,如果你仔细观察会发现这份研报并非单纯的文字描述,是图文并茂的,比如我们拆出来看“哪些彩妆品牌适合新手入门”这个章节,它对每一个美妆品牌和产品都给出了正确的参考图片,信息一目了然,可读性非常高。

输出的结果中不只有图文,还有对比表格,比如:当我们想了解香奈儿5号和邂逅香水时,天工AI能直接输出左右对比的表格,视觉体验非常友好。

这个画面大家是不是有点眼熟?没错,这样的表现和谷歌刚刚发布的Gemini demo中的示例如出一辙!

对于C端市场来说,产品的用户体验是非常重要的,而影响用户感知的,是使用过程中的各个细节,比如和Gemini高度相似的图文交织搜索体验,目前这样的体验效果国内只有天工AI做到了。

如果你觉得上述信息过多,还可以直接让它帮忙总结摘要,即刻触发天工AI的多步骤推理能力。巧了,还是和Gemini demo中的示例一模一样,不仅会主动问我需要总结哪方面的内容,同时也支持自定义个性化澄清:

这款辅助推理小卡片真的让人感动。它能主动澄清、询问、响应用户的提问需求,这种体验让我觉得,真正理解用户的搜索引擎出现了,你提问的对面不再是一个冷冰冰的搜索系统,而是可以有温度的私人助理。

第二步:AI写作+AI文档,5分钟搞定脚本创作

当我们尝试使用天工AI的【AI写作】和【AI文档】来快速制作脚本时,整个过程简直高效得令人惊喜!

首先,我们可以利用天工AI强大的文档分析理解能力,一键导入所需的产品信息。然后,它卓越的写作能力就会根据我们的要求,快速生成一个脚本:

我们可以看到,通过天工AI生成的脚本内容丰富、操作感强。只需简单几步操作,就能快速产出一个高质量、完成度极高的脚本,省去绞尽脑汁想创意的时间!而且,脚本的质量远超过了自己动手写的水平,对于运营入门小白非常友好!

同时小编还注意到一个细节,为什么推广5号香水还要提到邂逅香水呢?

有心了!是非常懂得打广告的小天才!

而且从我们提问得到的答案中可以看出,天工AI经过了认真仔细的分析和处理,回答有理有据,一看就是认认真真“读过”资料没有胡说八道的样子!

我还测试了天工AI在没有文档解析时的创作能力,让它生成了一个名为《重生之我是马斯克,我在OpenAI做AGI》的视频脚本:

令人惊讶的是,这个脚本的完成度也非常高,无论是内容的连贯性还是细节的丰富程度,都达到了可以直接拍摄成为TikTok爆款的水平~

第三步:天工AI音乐,5分钟生成专属BGM

天工AI拥有的AI音乐是国内唯一可以免费体验AI音乐生成的产品,这得益于今年4月刚推出的SkyMusic大模型,这个模型是全球首款并达到SOTA效果的AI音乐生成模型。

只需要输入歌名,AI帮你填充歌词,再喂给它一首你想要的风格歌曲,比如《坤坤神曲》,立马生成一首旋律朗朗上口的歌。专辑封面、背景效果都给你一键生成。BGM也不愁了。

当我们需要一首命题的背景音乐来配合你的新媒体时,我们可以试试天工AI的音乐生成功能!



配乐的难题天工AI也完美解决!

第五步:用AI视频转绘,自己出镜当主角

还最近还有一个特别有趣的功能悄悄上线——「AI视频转绘」智能体。这个功能可以一键将视频转换成动漫风格或迪士尼风格。从生成的视频来看,效果持续稳定,视频播放流畅自然。

重点是,这个功能免费啊家人们!还不冲吗!

用天工AI,我们轻松一站式搞定了抖音运营的核心步骤,整个过程不到20分钟!成品的质量不仅超乎预期,而且还超好。最棒的是,有了AI的帮助,我们能更快、更便捷地创作出更棒的作品,甚至还能让视频动漫化、风格化,创造出需要但之前不存在的配乐。

这才是真正发挥了AI的力量~ 通过天工AI,我们不仅节省了花费时间,还提升了创作的自由度和质量,实现了以前难以做到的事情。

第六步:用AI ppt,3分钟生成PPT直接做分享

这时候,小编注意到网站侧边栏有一个叫“AI PPT”的按钮。

如果让它把上面几千字的报告做成一份PPT,我岂不是都可以直接去卖课了?!(虽然自己还没学会!但是已经会用它赚钱了

说干就干!我直接把报告内容粘贴进去,输入指令“帮我做一份抖音美妆博主运营的PPT”。首先,天工AI展示了PPT的文本概要,然后点击“生成PPT”,它立刻就帮我制作出了一份完整的PPT:

看看这效果,目录清晰、图文并茂,都不需要配图了,我愿称之为“PPT大师”!更棒的是,可以选择以PDF或PPTX格式下载,直接免费导出一份现成的PPT。

至此,仅用半小时就完成了从一个简单的需求“了解抖音美妆博主运营知识”到制作出一份详尽的研究报告,再到一份精美的PPT的全过程。如果没有天工AI,这些工作需要至少一周以上的时间。

通过整个过程可以切实的感受到天工AI强悍的多模态能力,无论是撰写研究报告、创作AI音乐、制作AI视频,还是图文生成,它都能轻松应对,它都能轻松拿捏~

通过这一系列体验,小编可以明确感觉到,支撑天工AI这样强大产品力的背后,一定有不容小觑的技术能力支撑!于是,我便顺势扒了一下天工AI背后的大模型——天工3.0。

超级应用背后的「天工3.0」

「天工3.0」是上个月昆仑万维刚发布并开源不久的最新基座大模型,基于自研技术,采用了和GPT-4相同的MoE架构,参数高达4千亿,是全球模型参数最大、性能最强的MoE模型之一。更重要的是,天工3.0是一款功能强大的多模态大模型,不仅擅长基础的文本处理,还在多模态处理如AI图片生成、AI音乐制作、AI动漫创作等方面表现出色。目前来看,国内还没有其他任何一款面向C端市场能将这么多模型功能集成在一起。

无论你想做点什么事,在天工AI 都能找到帮的上你的工具~ 总之,由于篇幅所限,小编在天工AI上发现的很多好玩的应用都没来得及分享,包括音乐生成、表格生成、以及各种智能体等,感兴趣的小伙伴点击【阅读原文】直接上手体验下吧~

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
日本东京地方法院驳回AI“发明”专利申请:发明人仅限于人类;Meta首发「变色龙」挑战GPT-4o,引领多模态革命丨AIGC日报音乐治疗≠听音乐,音乐如何在咨询室中发挥效力?|音乐治疗明天开课华为“打样”破圈,芯片+OS+应用生态「挑战」高通座舱霸主Bill Maher 说的没有错北京内推 |​ 商汤研究院基础多模态大模型组招聘多模态方向算法实习生最知心的朋友岁运 -盖头,截脚硕博大瓜!26页PPT长文控诉上交博士玩弄感情,PPT规范得导师看了都流泪!GPT-4o成为全领域SOTA!基准测试远超Gemini和Claude,多模态功能远超GPT-4「活动六边形战士」就能进梦校?撕去华丽包装,打造「原创性」项目!关于 RAG、AI Agent、多模态,我们的理解与探索GPT-4o 与 Gemini 能否用多模态撬开下一代 AI 的新进程?CVPR 2024 | 多模态合作学习的新视角:样本级模态的评估与协同全世界众多盐湖出现神秘六边形!它们是怎么形成的?ICLR 2024 | 量化和增强模态偏好影响下的多模态鲁棒性笔记上百页!同寝室的她们得到世界名校录取,回国后计划……多模态GPT-4o来了,最先嗨起来的是一波女性用户AI早知道|百度即将发布全新App腾讯元宝;行业首发多模态大模型辅助视障人士Meta首发「变色龙」挑战GPT-4o,34B参数引领多模态革命!10万亿token训练刷新SOTA“中国男人应该娶我们俄罗斯女人”!澳女视频遭搬运篡改,竟在抖音爆红数万人观看上传丁丁照、1分钟看性病,我看不懂的AI应用又多了9.1入住|接本科生 |近伯克利步行1分钟/NEU步行11分钟/BU步行15分钟1B1B 3100,包供暖和热水上海AI Lab开源首个可替代GPT-4V的多模态大模型禁止使用!微信、抖音最新公告多模态大模型不够灵活,谷歌DeepMind创新架构Zipper:分开训练再「压缩」国产端侧小模型超越 GPT-4V,「多模态」能力飞升未央播报 | 央行进一步推动优化支付服务工作 OpenAI发布多模态大模型GPT-4o梗图理解“天花板”!港中文终身教授贾佳亚团队推出多模态模型:GPT-4+DALL-E 3,王炸组合刷爆榜单如何靠AI变身“六边形战士”|得到快刀青衣&中国AIGC产业峰会【忽然一周】奥飞娱乐、高乐股份、星辉娱乐、实丰文化发布财报;抖音电商针对部分商家推出GMV返现地磁暴对AI Claude 3的影响,绝顶聪明了蚂蚁百灵大模型一号位:GPT-4o发布不意外,原生多模态方向已明抖音爆品制造能力有多强?蕾哈娜都亲自摊上煎饼了阿根廷布宜诺斯艾利斯(Buenos Aires),城市老建筑8B文字多模态大模型指标逼近GPT4V,字节、华师、华科联合提出TextSquare
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。