Redian新闻
>
阿里音频生成大模型一次发俩还开源!50种语言快速理解+5种语言语音生成,带情感的那种

阿里音频生成大模型一次发俩还开源!50种语言快速理解+5种语言语音生成,带情感的那种

公众号新闻

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
中国电信发布首个支持30种方言混说语音大模型;奥飞娱乐发布“喜羊羊”首款AI智能产品,大电影预计年内上映丨AIGC日报靠Scaling Laws炼出4D版视频生成模型,多伦多大学北交大等携手开源81K高质量数据集上帝视角下的蓝天白云?大模型改变气象预测格局 | 大模型一周大事最难方言温州话被攻克!中国电信语音大模型支持30种方言,这题GPT-4o可不会做啊Stability AI开源47秒音频生成模型,虫鸣鸟叫、摇滚、鼓点都能生成办公、代码赛道应用竞争白热化,音乐生成新贵 Suno 和 Udio 深陷侵权诉讼 | 大模型一周大事这家世界模型公司发布中国版Sora级视频生成大模型,走向世界模型打造新一代数据引擎发布屡次截胡?OpenAI与谷歌携新版大模型再度交锋 | 大模型一周大事AI 生成人物视频翻车?商汤推出可控人物视频生成模型 Vimi今日arXiv最热大模型论文:大模型都能怎么用?中南大学最新综述:大模型时代的自然语言处理字节跳动科学家组团演讲,揭秘AI视频生成大招!首个4D视频生成扩散模型!数分钟实现4D内容生成,超81K优质数据集已开源阿里开源语音处理模型 FunAudioLLM :50 种语言无缝翻译,还能识别语音情绪上海AI lab开源LLaMAX,用3.5万小时的A100训练让大模型掌握上百种语言翻译AI早知道|B 站开源轻量级 AI 语言模型;阿里通义Qwen2成最强开源大模型发布即被山寨?字节跳动推出语音生成模型数小时后就被“盗版”,作者直呼离谱!阿里云进军大模型一年,现在是开源第一名,CTO:闭源要超过所有开源模型才有机会参与讨论Diffusion4D:首个4D视频生成扩散模型!数分钟内实现4D内容生成,超81K的4D数据集已开源!视频生成大战2.0!大厂狂卷底层模型,创企5个月吸金44亿“我们坚持开源!”阿里云发布“地表最强”中文大模型:半年一迭代、性能翻倍?AI早知道|业内首个多方言语音识别大模型;苹果 Safari 18浏览器 AI 功能曝光昇腾社区回应网传华为发布会大模型生成图片系人工操控;Sam Altman:新款语音模型GPT-4o尚未发货丨AIGC日报Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人国产版Sora到来!视频大模型更上一层楼 | 大模型一周大事谷歌翻译宣布新增110种语言:覆盖全球8%人口腾讯混元文生图大模型开源:Sora 同架构,更懂中文,已支持 16s 视频生成阿里通义千问2.5大模型发布;阿里达摩院提出“知识链”框架,逐步纠错降低大模型幻觉丨AIGC日报剑桥大学:基于语音的大模型攻击,轻松“操纵”多模态大模型规格拉满!Llama和Sora作者都来刷脸的中国AI春晚,还开源了一大堆大模型成果炸裂!讯飞现场大秀强干扰语音识别,星火4.0霸榜八个榜单,74种语言自由交流
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。