AI早知道|同花顺推出问财大模型;Midjourney将推文本转视频模型;谷歌即将推出Bard Assistant
1.阿里巴巴开源项目DreamTalk,能让人物头像栩栩如生地说话,支持多语言、歌曲、嘈杂音频匹配,开放更多开发者创新。
2.同花顺问财推出了 HithinkGPT 大模型,采用 transformer 的 decoder-only 架构。提支持 API 接口调用、网页嵌入、共建、私有化部署等能力,并为用户提供一站式标注和评测服务。
3.腾讯推出的M2UGen是一款多模态音乐生成框架,结合音乐和多模态任务,支持从文字、图像、视频生成音乐,并具备强大的编辑功能。(体验地址:https://top.aibase.com/tool/m2ugen)
4.Midjourney公司计划在未来几个月推出“文本转视频”模型,通过在1月开始培训视频模型,强调其自然发展和在生成视频领域引入竞争动态,同时V6更新提升画质和用户体验。
5.人工智能公司“斑头雁智能科技”近日完成近千万美元A轮融资,用于继续深入打造企业级AI Agent(人工智能代理)产品BetterYeah AI。
6.谷歌即将发布与Bard合作的增强助理,最新应用程序更新展示新设计,包括弹出窗口和标签切换器,同时对股票和金融小部件进行调整。
7.摩根大通发布了DocLLM,一款专为多模态文档理解设计的生成式语言模型,通过轻量级扩展LLM,避免昂贵的图像编码器,以提高文档分析效能。
8.法律人工智能助理制造商Robin AI在B轮融资中筹集了2600万美元,旨在简化法律合同的创建和评估,防止合同审查过程中关键细节被忽视的风险。
想要了解更多AI 行业资讯以及ChatGPT和AI绘画实战案例,欢迎加入我们的「互联网AI早读课」知识星球!
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章