美版「贴吧」终于上市,ChatGPT 之父和腾讯都赚翻了 | Hunt Good 周报公众号新闻2024-03-24 04:03欢迎收看最新一期的 Hunt Good 周报!在本期内容你会看到:7 条新鲜资讯3 个有用工具1 个有趣案例4 个鲜明观点Hunt for News|先进头条👀 Stability AI 并不 stable生成式 AI 独角兽 Stability AI 最近可谓是风波不断。前不久,Stable Diffusion 开发者之一 Robin Rombach 已经正式从公司辞职。一年来,这家公司的技术团队动荡不断,首席技术官换人,首席信息官、工程副总裁、产品副总裁、研发副总裁、研究主管、大语言模型负责人等陆续离职。而就在昨日上午,Stability AI 再次突然发布一项公告,Stability AI 的CEO Emad Mostaque 宣布辞去公司首席执行官及董事会职务,以追求去中心化人工智能。详情可回看 APPSO 以往的文章:最先倒下的 AI 明星公司,可能是它3 个月前,全球最大 AI 开源社区 Hugging Face CEO 曾对 2024 年的 AI 行业做了 6 条预测,其一是:某个当红的 AI 公司会破产,或者以极低的价格被收购。如今看来,Stability AI 或许是第一个,但不会是最后一个。🔗 https://t.co/wPjCKTiavp👏 脑机接口首位受试者用意念在 X 上发帖29 岁的美国男子 Noland Arbaugh 在一次潜水事故中导致颈部以下瘫痪八年,现已通过 Neuralink 的植入式脑机接口技术,实现了用思维操控电脑下国际象棋、玩《文明 6》的复杂操作。昨日,Noland 更是通过意念在社交平台上发布了第一条帖子:「Twitter 封了我的号,因为他们认为我是机器人,现在马斯克帮我解封了,因为我就是一个机器人」马斯克此前还透露,Neuralink 的下一个产品将是能够帮助盲人恢复视觉的 Blindsight。(脑机接口视觉的)分辨率一开始会很低,就像早期的任天堂显卡一样,但最终可能会超过正常的人类视觉。🔗 https://twitter.com/ModdedQuad/status/1771230292839145541🥣 微软「掏空」独角兽 Inflection AIMustafa Suleyman(DeepMind 联合创始人)作为 CEO 筹集 15 亿美元创立了 Inflection AI。但在本周,三位联合创始人中的两位 Mustafa 和 Karén 将离开 Inflection,跳槽到微软的 Microsoft AI(微软新部门,将整合消费者 AI 工作以及 Copilot、Bing 和 Edge)同时,Inflection AI 表示,Mozilla 前研发主管 Sean White 将担任其新任首席执行官,并计划将重点转向为商业客户提供模型,不再专注于消费者领域。🔗 https://twitter.com/inflectionAI/status/1770119871021621338🧑🏻💻 老黄才是这个时代的乔布斯英伟达在其年度GTC开发者大会上发布了一系列新的 AI 硬核产品。Blackwell GPU 拥有 2080 亿个晶体管,使用了台积电的 4NP 制程工艺,具有192GB 的 HBM3E 内存,AI 算力达到 20 petaflops(FP4精度),是上一代 H100 GPU 的五倍。Blackwell 平台的 GPU 在处理大型语言模型(LLM)时,相比 H100,推理性能提升了 30 倍,同时成本和能耗降低为原来的 1/25。Blackwell 架构的 GPU 分为 B200 和 GB200 产品系列,后者集成了一个 Grace CPU和两个 B200 GPU。这些产品预计将于今年晚些时候发货。详情可回看 APPSO 以往的文章:💥 深夜炸场!英伟达发布全球最强 AI 芯片,性能暴涨 30 倍,老黄才是这个时代的乔布斯🔗 https://mp.weixin.qq.com/s/z-O0G3i6QweJ0qIkFeu3mw👍 马斯克开源Grok-1,3140 亿参数迄今最大在一片质疑声中,信守承诺的马斯克卡在最后一日正式开源了 GroK,现在压力也狠狠给到了 OpenAI。好消息是, 马斯克开源了 Grok 1.0 的完整代码,坏消息是,关于模型完整的训练过程和细节却是一点也没透露,这就好比给你一本详尽的教科书让你自学成才。根据 Apache 2.0 许可协议, 现在公众可以自由访问模型的权重和架构。以下是关于 Grok 1.0 的一些关键信息:模型参数数量高达 314B混合专家模型(MoE 架构)每一个数据单元由 2 位专家处理嵌入向量的维度为 6144采用旋转式嵌入表示最大序列长度为 8192 个数据单元,以处理更长的上下文信息🔗 https://x.ai/blog/grok-os💰 美版「贴吧」上市股价飙涨历经波折的美版「贴吧」Reddit 终于上市了。上市首日,Reddit 的股票大涨 48%,收盘价为 50.44 美元,市值达到 98 亿美元。Reddit 自称为「网络社区」,拥有超过 10 万个不同的「Subreddit」(贴吧),涵盖各种主题,从减肥到法律,从区块链到宗教等。用户通过发帖和评论积累「Karma」值,以提高发帖的排名权重。值得一提的是,Reddit 的大股东之一、OpenAI 的联合创始人 Sam Altman 持有该公司 8.7% 的股份,仅次于康泰纳仕出版集团和腾讯。🔗 https://twitter.com/Reddit💥 OpenAI 悄然提交语音商标申请近日,OpenAI 悄悄提交了一项名为 VOICE ENGINE™ 的商标注册申请。该商标涉及的业务涵盖:语音和语音识别、处理语音命令以及文本和语音之间的转换自动语音识别和生成基于自然语言提示、提示、文本、语音、视觉提示、图像和/或视频创建和生成语音和音频输出构建数字语音助手响应用户提示生成音频和/或语音使用和定制经过大量数据训练的大型人工智能模型基于机器学习的自然语言和语音处理、识别和分析,多语言语音识别、翻译和转录使用人工智能自动进行文本到语音和文本到音频的转换用作应用程序编程接口 (API)跨全球计算机网络、无线网络和电子通信网络开发语音服务交付和自然语言理解技术🔗 https://uspto.report/TM/98456635Hunt for Tools|先进工具🥊 长文本技术又卷起来了?国内大模型卷起来了,这一次,目标瞄准了长上下文技术。前不久,国内大模型厂商 Moonshot AI(月之暗面)宣布 Kimi 智能助手实现了技术突破,将无损长上下文长度提升至 200 万字,并已启动产品「内测」。随后,各大厂商也纷纷亮出了自家的底牌:阿里通义千问:向所有用户免费开放 1000 万字长文档处理功能360 智脑:360AI 浏览器已向用户免费开放 100 万字长文本阅读功能百度文心一言:下个月将开放 200-500 万字的长文本能力这类技术的意义或许在于革新了繁琐的「阅读」过程,留给人类的只剩下「思考」了。🔗 https://mp.weixin.qq.com/s/Use\_FjOxe58pzatdM8O0mQ🚀 Stable Video 3D 震撼登场近日,风雨飘摇的 Stability AI 推出了其最新的 3D 视频创作工具——「Stable Video 3D」。这一创新模型源自于 Stable Video Diffusion 技术,旨在显著增强三维内容的生成品质和视角多样性。Stable Video 3D 在新颖视图合成(NVS)技术方面取得了突破性进展,它不仅能够生成流畅且视角连贯的 3D 视频,还提升了模型对不同姿态的控制能力,确保在多个视角下生成的对象保持外观的一致性。该模型提供了商业使用和非商业使用两种选项,商业用户可以通过成为 Stability AI 的会员来获得服务;而非商业用途用户可以直接在 Hugging Face 平台上获取模型权重,以便自由下载和使用。🔗 https://stability.ai/news/introducing-stable-video-3d🎵 Suno V3 上线,AI 音乐时代来了近日,在预热良久之后,Suno AI 如期上线了最新版本 V3。Suno V3 提供了两种主要模式,Custom Mode(自定义模式)和 Instrumental(纯音乐模式)。视频源自 X 网友 @jesselaunz用户可以通过编写 prompt 和歌词来生成音乐,平台每天为免费用户提供一定数量的积分来生成音乐。Suno 体验地址:https://app.suno.ai/🔗 https://twitter.com/jesselaunz/status/1771353776622039485Hunt for Fun|先行🤖 你的下一个 AI 助手会是开源的吗01 Light 是一款开源 AI 硬件,允许用户通过语音操控电脑,执行各种任务,如查看天气、日程安排,甚至远程处理邮件和文档编辑。它还能够在人类指导下学习使用新软件,例如发送 Slack 消息。团队计划在未来几个月添加对 Azure 和 PlayHT 的支持,加入控制计算机的开源大模型,发布适用于手机的原生应用,以及发布完全离线版的设备。视频来自 @op741801 Light 的售价为 99 美元,比同类产品 Rabbit R1 的 199 美元便宜。首批预售产品在上线 2.5 小时后迅速售罄。更重要的是,01 Light 的相关软件配置和硬件设计,包括 CAD 文件和电路图等,都可以在 GitHub 上找到,方便 DIY 爱好者自行制作。GitHub 地址:https://github.com/OpenInterpreter/01🔗 https://twitter.com/OpenInterpreter/status/1770821439458840846Hunt for insights|先知🧑🎓 Transformer 七子 重聚 GTC英伟达的黄仁勋在 GTC 大会上邀请了 Transformer 模型的七位作者(Niki Parmar 未能出席)参与圆桌讨论,共同探讨 AI 的未来发展。其中,论文作者之一 Lukasz Kaiser 分享了 Transformer 架构最初的设计理念,即模拟 token 的演化过程,超越线性生成,实现文本或代码的逐步发展。另一位作者 Illiya Polosukhin 则强调了 AI 能耗问题的重要性,提出自适应计算是接下来必须解决的事情之一,「人类需要知道在特定问题上应该花费多少计算资源」。另外,在 GTC 大会的第二天,黄仁勋接受了媒体采访。他表示,英伟达芯片的制造涉及到复杂的产业链,「许多部件来自中国,这是事实。」对于生成式 AI 的未来,黄仁勋充满信心,他认为传统检索模式的能耗实际上高于生成式 AI。他预测,未来与计算机的每次交互和屏幕上的每个像素都将由生成式芯片产生。未来每个人的计算体验都将变成生成式的,对这一点我并不会感到意外。🔗 https://mp.weixin.qq.com/s/Vxmlgh\_ldJNa5RNwFSHmUA😍 吴恩达:AI 智能体工作流今年将有巨大进展近日,斯坦福大学教授吴恩达在社交平台 X 上发文称,AI 智能体工作流将在今年推动人工智能取得巨大进步,甚至可能超过下一代基础模型。吴恩达认为 AI 智能体是一个重要的趋势,并呼吁所有从事 AI 工作的人都应该关注它。为了更好地解释 AI 智能体,吴恩达还专门发布了一篇博客。博客中提到,目前主要在零样本模式下使用大型语言模型(LLM),但通过智能体工作流,可以要求 LLM 进行多次迭代文档,包括规划大纲、网络搜索、写初稿、修改草稿等步骤,这种迭代过程对于写出好的文本至关重要。同时,吴恩达还分享了一个对构建智能体的设计模式进行分类的框架,包括反思、工具使用、规划和多智能体协作。🔗 https://www.deeplearning.ai/the-batch/issue-241/🕊️ OpenAI 拟于年中推出 GPT-5在最近的深度访谈中,OpenAI CEO Sam Altman 暗示今年将推出一个重大的模型迭代,预计是 GPT-5/GPT-4.5 Turbo。尽管他对 GPT-4 的评价不高,认为它「很糟糕」,但他表示新版本将实现类似 GPT-3 到 GPT-4 的能力提升。而据 The Business Insider 报道,OpenAI 计划今年夏季发布 GPT-5,一些企业客户已经体验了新模型和增强的 ChatGPT 功能,并对 GPT-5 的表现给予了高度评价。此外,OpenAI 还暗示了模型其他尚未公开的特性,包括能够调用 OpenAI 正在开发的 AI 代理来自动执行任务。🔗 https://mp.weixin.qq.com/s/se0w7WcyzCUqhu45q4i7PQ😱 AI 教父辛顿:AI 将操控人类「AI 教父」杰弗里·辛顿近日接受了日本经济新闻(日经中文网)的专访,深入讨论了 AI 的发展前景及其对人类未来的潜在威胁。在采访中,辛顿教授透露他曾向 Google 首席科学家杰夫·迪恩表达过对 AI 可能引发人类生存危机的担忧。辛顿教授认为,如果给 AI 设定目标,它可能会采取对人类不利的手段来实现这些目标。他还提出了未来 AI 之间可能发生的竞争,以及这种竞争可能推动 AI 进化的设想。很多人主张,要防止 AI 失控,只要关掉电源开关就可以。但超越人类智慧的 AI 可以用语言操纵我们。或许会试图说服我们不要关掉开关。辛顿教授还谈到了他的学生、OpenAI 联合创始人伊尔亚·苏茨克维对 AI 安全性的担忧,以及联合国针对 AI 军事应用的限制性决议。他预测,未来 10 年内将出现自主杀死人类的机器人武器,并认为这些武器或许最终也会受到国际限制。🔗 https://cn.nikkei.com/columnviewpoint/viewpoint/55090-2024-03-22-05-00-32.html彩蛋时间《生机》作者:@AethericaArt工具:Midjourney V6链接:https://twitter.com/SmokeAwayyy/status/1767430320083845583微信扫码关注该文公众号作者戳这里提交新闻线索和高质量文章给我们。来源: qq点击查看作者最近其他文章