Redian新闻
>
港大和字节提出Groma:多模态大模型新范式!模拟人类先感知后认知,精确定位图中物体!

港大和字节提出Groma:多模态大模型新范式!模拟人类先感知后认知,精确定位图中物体!

公众号新闻

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
颜水成挂帅,奠定「通用视觉多模态大模型」终极形态!一统理解/生成/分割/编辑零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR未央播报 | 央行进一步推动优化支付服务工作 OpenAI发布多模态大模型GPT-4o​第一个基于Llama 3的多模态大模型!Bunny-Llama-3-8B-V上线!专治大模型说胡话,精确率100%!华科等提出首个「故障token」检测/分类方法北京内推 | 中国电信人工智能研究院招聘多模态大模型算法研发实习生多模态大模型+自动驾驶=?ECCV'24这场Workshop开启招募啦ACL 2024 | 多模态大模型能揭示图像背后的深意吗?赋予机器人思考能力!北大提出自纠正多模态大模型,赋能端到端机器人操作北大字节开辟图像生成新范式!超越Sora核心组件DiT,不再预测下一个token空手套白狼北京内推 |​ 商汤研究院基础多模态大模型组招聘多模态方向算法实习生量化大模型退化严重?ETH北航字节推出LoRA新范式 | ICML 2024HuggingFace烧钱做了一大批实验,揭示多模态大模型哪些trick真正有效8B文字多模态大模型指标逼近GPT4V,字节、华师、华科联合提出TextSquare荐书丨中山大学 HCP 实验室专著《多模态大模型》重磅发布李未可科技古鉴:发布自研多模态大模型WAKE-AI,三大优化让AI眼镜交互体验升级 丨GenAICon 2024再回首 (三十四)五光十色的多模态大模型:浅探视觉-语言大模型的关键模块设计国产多模态大模型狂飙!颜水成挂帅开源Vitron,破解图像/视频模型割裂问题新產品集資元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入生命是漂泊的云文末送书 | 中山大学HCP实验室专著《多模态大模型》重磅发布多模态大模型不够灵活,谷歌DeepMind创新架构Zipper:分开训练再「压缩」中国移动千亿多模态大模型发布,「九天-九九」风趣畅聊堪比GPT-4oICML 2024 | 量化大模型退化严重?ETH北航字节推出LoRA新范式上海AI Lab开源首个可替代GPT-4V的多模态大模型港大字节提出多模态大模型新范式,模拟人类先感知后认知,精确定位图中物体国产多模态大模型开源!无条件免费商用,性能超Claude 3 SonnetGPT-4o仅排第二!北大港大等6所高校联手,发布权威多模态大模型榜单!二十二年AI早知道|百度即将发布全新App腾讯元宝;行业首发多模态大模型辅助视障人士轻松拿捏4K高清图像理解!这个多模态大模型自动分析网页海报内容,打工人简直不要太方便AI早知道|元象开源首个多模态大模型XVERSE-V;信通院发布国内首个汽车大模型标准
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。