Redian新闻
>
港大和字节提出Groma:多模态大模型新范式!模拟人类先感知后认知,精确定位图中物体!

港大和字节提出Groma:多模态大模型新范式!模拟人类先感知后认知,精确定位图中物体!

公众号新闻

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
生命是漂泊的云国产多模态大模型狂飙!颜水成挂帅开源Vitron,破解图像/视频模型割裂问题专治大模型说胡话,精确率100%!华科等提出首个「故障token」检测/分类方法AI早知道|元象开源首个多模态大模型XVERSE-V;信通院发布国内首个汽车大模型标准五光十色的多模态大模型:浅探视觉-语言大模型的关键模块设计HuggingFace烧钱做了一大批实验,揭示多模态大模型哪些trick真正有效空手套白狼未央播报 | 央行进一步推动优化支付服务工作 OpenAI发布多模态大模型GPT-4o剑桥大学:基于语音的大模型攻击,轻松“操纵”多模态大模型新產品集資字节、华科发布多语种视觉文本理解新基准,多模态大模型还有很长的路要走8B文字多模态大模型指标逼近GPT4V,字节、华师、华科联合提出TextSquare北京内推 |​ 商汤研究院基础多模态大模型组招聘多模态方向算法实习生文末送书 | 中山大学HCP实验室专著《多模态大模型》重磅发布国产多模态大模型开源!无条件免费商用,性能超Claude 3 Sonnet元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入港大字节提出多模态大模型新范式,模拟人类先感知后认知,精确定位图中物体再回首 (三十四)量化大模型退化严重?ETH北航字节推出LoRA新范式 | ICML 2024上海AI Lab开源首个可替代GPT-4V的多模态大模型北大字节开辟图像生成新范式!超越Sora核心组件DiT,不再预测下一个token​第一个基于Llama 3的多模态大模型!Bunny-Llama-3-8B-V上线!李未可科技古鉴:发布自研多模态大模型WAKE-AI,三大优化让AI眼镜交互体验升级 丨GenAICon 2024哈工深聂礼强:多模态大模型是具身智能发展的关键动力丨具身智能十人谈荐书丨中山大学 HCP 实验室专著《多模态大模型》重磅发布ICML 2024 | 量化大模型退化严重?ETH北航字节推出LoRA新范式扩散模型也能推荐短视频!港大腾讯提出新范式DiffMM赋予机器人思考能力!北大提出自纠正多模态大模型,赋能端到端机器人操作上交&阿里:掀开多模态大模型的头盖骨,解密黑盒模型推理过程颜水成挂帅,奠定「通用视觉多模态大模型」终极形态!一统理解/生成/分割/编辑二十二年GPT-4o仅排第二!北大港大等6所高校联手,发布权威多模态大模型榜单!联汇科技OmChat:突破长视频理解极限的多模态大模型北京内推 | 中国电信人工智能研究院招聘多模态大模型算法研发实习生轻松拿捏4K高清图像理解!这个多模态大模型自动分析网页海报内容,打工人简直不要太方便
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。