- MLP一夜被干掉,全新神经网络架构KAN破纪录!MIT华人一作,轻松复现Nature封面AI数学研究
夕小瑶科技说 分享 来源 | 量子位一种全新的神经网络架构KAN,诞生了!与传统的MLP架构截然不同,且能用更少的参数在数学、物理问题上取得更高精度。比如,200个参数的KANs,就能复现DeepMind用30万参数的MLPs发现数学定理研究。不仅准确性更高,并且还发现了新的公式。要知道后
- 上海AI Lab开源首个可替代GPT-4V的多模态大模型
夕小瑶科技说 原创 作者 | 任同学与开源和闭源模型相比,InternVL 1.5 在 OCR、多模态、数学和多轮对话等 18 个基准测试中的 8 个中取得了最先进的结果。上海AI Lab 推出的 InternVL 1.5 是一款开源的多模态大语言模型 (MLLM),旨在弥合开源模型和专有
- 今日arXiv最热大模型论文:首个面向AI的python编程框架,提升大模型编程能力新思路
夕小瑶科技说 原创 作者 | 谢年年高级编程语言Python有两个受众:一是编译和执行程序的机器,二是阅读、理解和编写程序的人类。机器关注程序的语义操作,而人类更强调代码的可读性。Python在语法中融入了许多以人类为中心的设计元素,以“可读性至上”为设计原则,因此Python也成为中最受
- 比Llama 3 推理更强的开源大模型出现了! Leetcode击败80%人类
夕小瑶科技说 分享Llama3 最近实在太火了!它的性能匹敌 Gemini 1.5 Pro,接近GPT-4,赢得了“最强开源大模型”的称号。国内外开源社区都为之感到振奋,果然开源大模型还是只能仰赖大洋彼岸的Meta吗?其实不然,笔者惊喜地发现在国内竟然有一家比 Llama3 更早的开源大模型SOTA
- 今日arXiv最热联邦学习论文:通信成本降低94%,中科院计算所发布个性化联邦学习方法
夕小瑶科技说 原创 作者 | Richard引言:你的隐私,联邦来守护!想象一下,未来你的手机就像一位贴心的私人助理,能够洞察你的喜好、日程,甚至预测你的情绪。听起来很棒,但你可能会担心隐私泄露的问题。别担心,最近一种名为“联邦学习”的创新技术或许能解决这个问题。它让各个手机上的AI模型只
- 神秘模型gpt2-chatbot实力被赞超越GPT-4:sam亲自确认,或是OpenAI全新模型
夕小瑶科技说 分享来源 | AI寒武纪一种神秘的新型AI模型"gpt2-chatbot"出现并引起广泛关注。网友们猜测它是否是OpenAI即将发布的GPT-4.5,或者是一种全新的AI系统。具体信息如下:今天大模型竞技场( http://chat.lmsys.org) 出现一个神秘的模型 gpt2-
- 今日arXiv最热大模型论文:复旦提出基于diffusion的虚拟试衣模型,模特一键换装
夕小瑶科技说 原创作者 | 谢年年仅需上传模特图像,便可一键换装,极大提高了用户网购衣服的效率。虚拟试衣(Virtual Try-On)作为图像生成中一个商业价值高、可以直接变现的子任务,研究热度随着图像生成技术的发展水涨船高。但现有的一些方法生成的效果还差点意思,如下图所示:基于GAN的方法换装后
- 全面解析RLHF,PPO,DPO,Flash Attention,增量学习等大模型算法
随着大模型的飞速发展,在短短一年间就有了大幅度的技术迭代更新,从LoRA、QLoRA、AdaLoRa、ZeroQuant、Flash Attention、KTO、PPO、DPO、蒸馏技术到模型增量学习、数据处理、开源模型的理解等,几乎每天都有新的发展。我们总结了算法工程师需要掌握的大模型微调技能,并
- 今日arXiv最热NLP大模型论文:超越GPT-4,清华发布网页导航智能体AutoWebGLM
夕小瑶科技说 原创 作者 | Tscom随着大语言模型(LLMs)的发展,Agent在网络导航等任务中展现出了前所未有的能力。想象一下,一个基于LLM的Agent能够在你享用早餐时为你总结在线新闻,这样的场景已经不再遥不可及。这种将LLMs融入日常任务的做法,不仅优化了我们与技术的互动方式
- 今日arXiv最热NLP大模型论文:韩国团队提出ResearchAgent系统,模仿人类产出论文idea
夕小瑶科技说 原创 作者 | 谢年年你是否还在苦于想发论文却没有idea?在浩瀚无边的文献中苦苦寻找却又无从下手?那些看似与你研究相关的文章,要么已经被人研究得透彻无比,要么与你的方向南辕北辙,让你倍感挫败。不要慌,让AI来助你一臂之力,从文献调研到发现问题,从制定研究方法到设计实验,AI
- 北大发现了一种特殊类型的注意力头!
夕小瑶科技说 原创作者 | 任同学检索头的发现或许将有力地帮助大模型领域在提高长上下文推理能力、减少幻觉和压缩KV缓存方面的研究。从 Claude100K 到 Gemini10M,我们正处于长上下文语言模型的时代。如何在长上下文中利用任何输入位置的信息?北大联合另外四所高校发现了一种特殊类型的、负责
- 今日arXiv最热NLP大模型论文:CMU最新综述:工具使用,大模型的神兵利器
夕小瑶科技说 原创作者 | Tscom引言:探索语言模型中的“工具”概念在当今的数字化时代,语言模型(Language Models, LMs)已经成为了人工智能领域的一大亮点,它们在处理文本生成任务中展现出了强大的能力。然而,尽管语言模型在理解和生成自然语言方面取得了显著的进步,它们在处理需要复杂
- 拜登召集奥特曼和李飞飞等入AI安全委员会,没带马斯克!库克考虑将iPhone AI服务委托给OpenAI
夕小瑶科技说 原创作者 | 付奶茶美国总统拜登最近成立了一个新的人工智能安全委员会,目的是解决人工智能技术可能对电网、机场等关键基础设施带来的潜在威胁。国土安全部部长Alejandro Mayorkas是委员会的主席,他强调:“如果在关键基础设施中未能以安全、可靠和负责任的方式部署AI,后果可能是灾
- 网传Llama 3比肩GPT-4?别闹了
夕小瑶科技说 原创作者 | 夕小瑶编辑部相信大家近期都被Llama 3刷屏了。Llama 3的预训练数据达到了15万亿,是Llama 2的7倍;微调数据用了100万条人工标注数据,是Llama 2的10倍。足以看出Meta训练Llama 3 是下了大血本的。开源社区拥抱Llama3也是空前热烈,发布
- 今日arXiv最热大模型论文:大模型也来看球,还能判断是否犯规
夕小瑶科技说 原创作者 | 谢年年在足球世界,裁判的哨声可谓“千金难买”,因为它能直接决定俱乐部的钱包是鼓是瘪。但球场变化莫测,非常考验裁判的水平。2022年卡塔尔世界杯上,半自动越位识别技术(SAOT)闪亮登场,通过12台摄像机,每秒50次追踪球员的29个数据点,精确绘制出越位线,辅助裁判做越位判
- 老黄将世界上第一台英伟达H200亲手交付给OpenAI
夕小瑶科技说 分享作者 | Zicy就在昨天,英伟达CEO黄仁勋亲自将第一台英伟达DGX H200交付给OpenAI位于旧金山的总部,预示着两大科技巨头未来的合作可能会更加紧密。我们先来看看H200有多强。怪兽级性能相比于去年的H100,H200又有了巨大的提升,首先是显存达到了141G并且显存带宽
- Open-Sora 全面开源升级:支持单镜头16s视频生成和720p分辨率
Open-Sora 在开源社区悄悄更新了,现在支持单镜头长达16秒的视频生成,分辨率最高可达720p,并且可以处理任何宽高比的文本到图像、文本到视频、图像到视频、视频到视频和无限长视频的生成需求。我们来试试效果。生成个横屏圣诞雪景,发b站再生成个竖屏,发抖音还能生成单镜头16秒的长视频,这下人人都能
- 苹果一次性开源了8个大模型! 包含模型权重、训练日志和设置,OpenELM全面开源
夕小瑶科技说 原创 作者 | 任同学不以开放性著称的苹果居然同时开源了大模型的权重、训练和评估框架,涵盖训练日志、多个保存点和预训练设置。同时升级计算机视觉工具包 CVNets 为 CoreNet!支持 OpenELM!▲图1.由Stable Diffusion3生成。OpenELM是Ap
- 微软发布!提示工程进化为位置工程,有效提升RAG与上下文学习
夕小瑶科技说 原创作者 | 谢年年别再光顾着优化提示工程啦!微软最近推出位置工程研究思路,只需调整token的索引位置,而不修改文本本身,就能显著提高任务性能。提示工程通过添加、替换或删除段落和句子改变提示,调整语义信息,激发LLMs的推理能力。比如CoT通过在问题的结尾附加“Let's think
- 国产AI搜索的黑马!没有广告,免费使用,科研狗:学术搜索太香了
夕小瑶科技说 分享作者 | 秘塔科技前段时间分享了饱受大模型幻觉困扰的学术圈,引起了大家的共鸣,大多数AI会出现不准确、不完整或误导性的输出,直接导致了我们无法信任AI所提供的信息。好在,早已有人考虑到了这一点(比如评论区的朋友)将AI和搜索引擎融合,既省略了逐个点开搜索网页的繁琐,又保证了内容更具