Redian新闻
>
港大和字节提出Groma:多模态大模型新范式!模拟人类先感知后认知,精确定位图中物体!

港大和字节提出Groma:多模态大模型新范式!模拟人类先感知后认知,精确定位图中物体!

公众号新闻

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
未央播报 | 央行进一步推动优化支付服务工作 OpenAI发布多模态大模型GPT-4o国产多模态大模型狂飙!颜水成挂帅开源Vitron,破解图像/视频模型割裂问题AI早知道|元象开源首个多模态大模型XVERSE-V;信通院发布国内首个汽车大模型标准港大字节提出多模态大模型新范式,模拟人类先感知后认知,精确定位图中物体生命是漂泊的云扩散模型也能推荐短视频!港大腾讯提出新范式DiffMMICML 2024 | 量化大模型退化严重?ETH北航字节推出LoRA新范式赋予机器人思考能力!北大提出自纠正多模态大模型,赋能端到端机器人操作​第一个基于Llama 3的多模态大模型!Bunny-Llama-3-8B-V上线!国产多模态大模型开源!无条件免费商用,性能超Claude 3 Sonnet再回首 (三十四)8B文字多模态大模型指标逼近GPT4V,字节、华师、华科联合提出TextSquare字节、华科发布多语种视觉文本理解新基准,多模态大模型还有很长的路要走HuggingFace烧钱做了一大批实验,揭示多模态大模型哪些trick真正有效空手套白狼荐书丨中山大学 HCP 实验室专著《多模态大模型》重磅发布上交&阿里:掀开多模态大模型的头盖骨,解密黑盒模型推理过程北京内推 |​ 商汤研究院基础多模态大模型组招聘多模态方向算法实习生量化大模型退化严重?ETH北航字节推出LoRA新范式 | ICML 2024哈工深聂礼强:多模态大模型是具身智能发展的关键动力丨具身智能十人谈李未可科技古鉴:发布自研多模态大模型WAKE-AI,三大优化让AI眼镜交互体验升级 丨GenAICon 2024专治大模型说胡话,精确率100%!华科等提出首个「故障token」检测/分类方法新產品集資二十二年GPT-4o仅排第二!北大港大等6所高校联手,发布权威多模态大模型榜单!五光十色的多模态大模型:浅探视觉-语言大模型的关键模块设计上海AI Lab开源首个可替代GPT-4V的多模态大模型元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入北京内推 | 中国电信人工智能研究院招聘多模态大模型算法研发实习生北大字节开辟图像生成新范式!超越Sora核心组件DiT,不再预测下一个token联汇科技OmChat:突破长视频理解极限的多模态大模型轻松拿捏4K高清图像理解!这个多模态大模型自动分析网页海报内容,打工人简直不要太方便颜水成挂帅,奠定「通用视觉多模态大模型」终极形态!一统理解/生成/分割/编辑剑桥大学:基于语音的大模型攻击,轻松“操纵”多模态大模型文末送书 | 中山大学HCP实验室专著《多模态大模型》重磅发布
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。