- 南大发布最新综述!全面解析如何使用预训练模型进行持续学习
©PaperWeekly 原创 · 作者 | 孙海龙单位 | 南京大学LAMDA实验室研究方向 | 预训练模型、MLLM论文标题:Continual Learning with Pre-Trained Models: A Survey论文地址:https://arxiv.org/abs/2401.1
- ECCV 2024 | 满分Oral论文!整数训练脉冲推理的高性能低能耗目标检测网络
©PaperWeekly 原创 · 作者 | 竹贤单位 | 中科院自动化所李国齐课题组研究方向 | 脉冲神经网络脉冲神经网络(Spike Neural Networks,SNN)因其生物合理性和低功耗特性,被认为是人工神经网络(Artificial Neural Networks,ANN)的一种有效
- 北京内推 | 微软搜索广告算法团队招聘LLM方向广告算法实习生
合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软亚洲互联网工程院微软搜索广告算法团队隶属微软亚洲互联网工程院,我们与来自全球的工程师团队一起搭建涵盖用户、广告主和搜索引擎在内的业界领先的广告生态系统。微软广告产品遍布美国、
- 大模型时代的AI4Science!北大高毅勤教授领衔的免费公开课,来听吗?
MindSpore SPONGE暑期学校火热招生中速来解锁AI+科学计算新技能由昇思 MindSpore 开源社区联合北京大学化学与分子工程学院、北京昌平实验室、深圳湾实验室举办的第四季「MindSpore SPONGE 暑期学校」正在火热招生中,目前已收到了来自国内多个知名高校、科研机构、企业等开
- 为什么最近多模态大模型工作中用Q-Former结构的变少了?
©作者 | 姚林丽单位 | 北京大学研究方向 | 多模态理解我们组最近的工作 DeCo: Decoupling Token Compression from Semantic Abstraction in Multimodal Large Language Models 比较深入地分析了 Q-for
- 小模型崛起!Llama 3.1 8B参数减半性能更强,英伟达把剪枝和蒸馏玩明白了
©作者 | 杜伟、陈陈、泽南来源 | 机器之心上个月,Meta 发布了 Llama 3.1 系列模型,其中包括 Meta 迄今为止最大的 405B 模型,以及两个较小的模型,参数量分别为 700 亿和 80 亿。Llama 3.1 被认为是引领了开源新时代。然而,新一代的模型虽然性能强大,但部署时仍
- 北京内推 | 小红书大模型机器学习团队招聘训练系统实习生
合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!小红书小红书是年轻人的生活方式平台,由毛文超和瞿芳于2013年在上海创立。小红书以“Inspire Lives 分享和发现世界的精彩”为使命,用户可以通过短视频、图文等形式记录生
- 清华联合蚂蚁提出TimeMixer,可分解多尺度融合的时序预测模型 | ICLR 2024
©PaperWeekly 原创 · 作者 | 杜大钊单位 | 中科院软件所研究方向 | 时序建模本文介绍清华和蚂蚁集团在今年发表在 ICLR 2024 上的一篇文章,也是基于 MLP 来做时间序列预测任务的。论文标题:TimeMixer: Decomposable Multiscale Mixing
- ACL 2024最佳论文开奖,多模态大模型爆火出圈!
这几天,ACL'24会议召开并公布了主会及最佳论文,多模态大模型实火,而闭幕不久的ICML'24会议也是如此,高频词大模型以600+次遥遥领先。但随着训练推理的深入,大模型也逐渐暴露出幻觉问题,研究落地面临极大挑战,于是,围绕其原因、检测、缓解等,近年顶会激增了一批大模型幻觉工作,在数据、基准、解码
- 博士申请 | 美国德州大学达拉斯分校陈至玉老师招收NLP方向全奖博士生
合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!UT Dallas德克萨斯大学达拉斯分校 (The University of Texas at Dallas,简称UTD或UT Dallas),位于美国德克萨斯州理查德森 (R
- 无需人工/GPT-4V排序,针对多模态大模型的全自动多级偏好学习
©PaperWeekly 原创 · 作者 | 吴文灏单位 | 悉尼大学博士生研究方向 | 多模态学习、视频理解前段时间分享了我们在多模态大模型(MLLM)视觉信号利用方面的思考:Dense Connector,今天想和大家分享一下我们在另一个正交维度的探索:在 MLLM 的人类反馈强化学习(RLHF
- 缝合几个模块实现了新SOTA,这样发论文算学术不端吗?
有创新点,就能顺利发paper吗?当然不是!有了创新点只是开始,模型的编码、调试才是重头戏。很多小伙伴都是改了大量的模型和代码,实验结果却没有多少提升,白白耽误投稿时间。今天就分享一些发paper必备的工具:82个即插即用缝合模块!这些模块就像积木一样,可以按照自己的想法插入到模型中,构建出自己的模
- ICML 2024 | 上海交大发布UP2ME,首个多用途通用时间序列分析框架
©作者 | ReThinklab单位 | 上海交通大学背景近年来,针对多变量时间序列分析的深度学习模型发展迅速,并被应用于多种不同的任务,如预测、缺失补全和异常检测等。在其中,很大一部分模型需要根据所执行任务的特性进行量身定制。例如,趋势-季节分解常被用于预测模型、条件扩散模型被用于缺失补全等。尽管
- 杭州内推 | 阿里淘天集团未来生活实验室招聘大模型算法实习生
合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴淘天集团未来生活实验室,聚焦于AI的发展,打造支撑电商及AI Native的大模型基座能力,兼顾对1-3年内和未来生活场景相关的前沿技术的研究和关注。既要支持好各个前台场
- 同济、NUS等提出GalleryGPT,巧妙运用大模型收集绘画图像-艺术分析文本数据
©PaperWeekly 原创 · 作者 | 宾燚单位 | 同济大学、NUS研究方向 | 视觉与语言动机和背景现有的多模态大模型大多聚焦于视觉信息(图像/视频)理解,特别是日常视觉内容理解。然而,作为人类社会发展和精神生活的重要组成部分,艺术作品(如绘画)分析被视为人类创造力的特有表现,智能分析还鲜
- 腾讯发布Project xDiT!打造DiT并行推理的vLLM
©PaperWeekly 原创 · 作者 | 方佳瑞单位 | 腾讯研究方向 | 机器学习系统上半年,我们见证了国内视频生成领域的迅猛发展。四月份,生数科技的 ViDu [1] 成功生成了 16 秒的电影级视频,不仅在视频号上引发了热烈反响,更揭开了中国 Sora 们崭露头角的序幕。而到了六月份,快手
- ACM MM 2024 | 突破传统方法局限!用语义正确性评估视觉问答生成结果
©PaperWeekly 原创 · 作者 | 季慧山单位 | 中科院信工所博士生研究方向 | 计算机视觉第 32 届 ACM 国际多媒体会议(ACM Multimedia 2024)预计于 10 月 28 日至 11 月 1 日在澳大利亚墨尔本举行。本届会议共收到 4385 篇有效投稿,其中 114
- 杭州内推 | VIVO影像算法研究部招聘AIGC+计算摄影算法工程师/实习生
合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!VIVOVIVO影像算法研究部是公司的核心算法部门,负责VIVO中高端旗舰手机的核心影像算法的研发,包括手机拍照的全套ISP流程、后处理优化等,聚焦于对照片的影调、色彩和画质等关
- 仅8B,全面超越GPT-4V!单图、多图、视频理解端侧三冠王!史上最强端侧多模态诞生
再次刷新端侧多模态天花板,面壁「小钢炮」MiniCPM-V 2.6 模型重磅上新! 仅 8B 参数,单图、多图、视频理解全面超越 GPT-4V! 更有多项功能首次上「端」:小钢炮一口气将实时视频理解、多图联合理解、多图 ICL 等能力首次搬上端侧多模态模型,更接近充斥着复杂、模糊、连续实时视觉信息的
- 北京内推 | 微软亚洲研究院媒体计算团队招聘安全AI方向研究型实习生
合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软亚洲研究院微软亚洲研究院媒体计算(MC)团队专注于多媒体研究,包括计算机视觉、音频、媒体压缩以及基于AI的实时通信优化等领域。他们主要从事场景理解、视觉识别和视觉媒体操作的工