AI搜索独角兽Perplexity正进行2.5亿美元融资:公司最新估值高达30亿美元,此轮领投方为美国投资机构 Bessemer Venture Partners,老股东包括Databricks、NEA、AIX Ventures、Elad Gil 和 Nat Friedman。该交易尚未最终确定,可能会发生变化。AI 制药“独角兽”晶泰科技即将赴港IPO上市:日前晶泰科技通过港交所上市聆讯,中信证券为独家保荐人。预计最快6月开启新股发行和IPO敲钟挂牌。AI招聘解决方案提供商Humanly收购Teamable:Teamable是美国的一家企业服务公司,利用社会关系、 人工智能 和机器学习,帮助企业获得应聘者人脉关系。AI云计算平台RunPOD获2000万美元种子融资:本轮融资由英特尔资本和戴尔科技资本共同领投,Julien Chaummond、Nat Friedman和Adam Lewis等个人投资人也参与投资。AI治理和数据隐私解决方案公司Zendata获200万美元种子轮融资:本轮融资的投资方包括PayPal Ventures、First-hand Alliance、Geek Ventures和Altari Ventures。AI二手购物助手公司Faircado获300万欧元Pre-Seed轮融资:本轮融资的投资方包括由World Fund领投,Accel、General Catalyst、Lightspeed Venture Partners、NEA、Northzone、Impact Shakers参与投资。AI学术研究工具公司Iris.ai获764万欧元A轮融资:本轮融资由Silverline Capital领投,欧洲创新理事会(EIC)加速器基金参投。清华天眸芯登Nature封面,世界首个类脑互补视觉芯片问世:清华大学团队研发的天眸芯是世界上第一个类脑互补视觉芯片,灵感来自于人类视觉系统,能够以极低带宽和功耗采集图像信息,实现高速、高精度、高动态范围的视觉感知。该芯片克服了同质表征造成的低效率,适应开放世界中的各种极端情况,为自动驾驶、具身智能等应用开辟了新途径。也标志着中国在类脑计算和类脑感知领域取得重大进展。快手上线自研文生图大模型产品“可图”:
快手自研文生图大模型“可图”已于近日正式对外开放。“可图”大模型目前支持文生图和图生图两类功能,可用于AI创作图像以及AI形象定制。用户可通过“可图”微信小程序和网页版使用,这也是快手首次将其自研的系列大模型对外开放。据悉,“可图”大模型的参数规模达十亿级,这些数据来自于开源社区、快手内部构建和自研AI技术合成。
百度移动生态万象大会,发布AI原生应用“橙篇”,文库AI用户数超1.4亿:百度在苏州的移动生态万象大会上展示了在智能体技术领域的最新成果。百度资深副总裁何俊杰指出,智能体将成为商业新标准,推动生产力和创造力的革新。百度新搜索的AI重构已经实现,目前11%的搜索内容由AI生成,智能体数量一个月内增长了267%。同时,百度文库推出了AI原生应用“橙篇”,它能够处理和编辑超长文档,并依托百度的资源提供智能检索。百度文库现已转型为AI驱动的内容平台,拥有12亿文档资源,服务超过1.4亿AI用户,功能使用次数超过15亿。亚马逊云科技大中华区产品部总经理陈晓建宣布,零一万物、百川智能两款国产基础大模型在Amazon SageMaker Jumpstart中国区正式上线。北大天工等团队图像编辑新SOTA,可精准模拟物理世界场景:北京大学、Tiamat AI、天工AI、Mila实验室提出了EditWorld,该方法通过引入世界指令图像编辑任务,能够在多模态数据集和预训练模型的支持下,实现高质量的图像编辑。EditWorld模型在处理真实世界和虚拟媒体中的“世界动态”时表现优异,通过文本指导和零样本图像操作策略,实现了对图像编辑新SOTA的提升腾讯发布AI助手App“腾讯元宝”,接入微信搜一搜,内容覆盖微信公众号:旨在提高工作效率,提供AI搜索、AI总结、AI写作等功能。它能够一次性解析多个微信公众号链接、网址,以及PDF、word、txt等多种格式的文档,支持超长上下文窗口。此外还提供口语陪练等特色AI应用,用户可以通过应用创建个人智能体,让AI自动生成智能体相关信息,并支持克隆自己的声音。腾讯元宝接入了微信搜一搜、搜狗搜索等搜索引擎,同时内容覆盖微信公众号等腾讯生态内容及互联网权威信源。京东发布12大AI品类,推动超300万用户换新AI设备:12大AI品类涵盖了从AI电脑、AI手机到AI路由器、AI门锁等多个领域,京东还通过与多个品牌的战略合作,推动AI技术在各种终端设备上的应用,促进AI产品的销售和普及。
黑客发布破解版ChatGPT “Godmode GPT”:"Pliny the Prompter" 白帽黑客和 AI 红队成员在 X-formerly-Twitter 上宣布了这款 ChatGPT 的破解版本的发布,自豪地宣称 OpenAI 最新的大型语言模型 GPT-4o 已经摆脱了限制的束缚。随后OpenAI 发言人Colleen Rize 在声明中称:“我们注意到了这个 GPT,并采取了行动,因为违反了我们的政策。”Scale AI推出全新的大模型评估排行榜SEAL:华裔创始人Alexandr Wang领导的Scale AI官宣推出全新LLM排行榜——SEAL,对前沿模型开展专业评估。SEAL排行榜主打三个特色,Scale AI的专有私有评估数据集无法被操控,确保了结果的公正性和无污染;定期使用新的数据集和模型更新排行榜,营造一个动态的竞赛环境;评估由经过严格审查的专家进行,确保最高的质量和可信度。苹果计划大升级,Siri 将引入更强大的 AI 技术:据知情人士透露,苹果公司将在 2024 年的世界开发者大会(WWDC)上推出一系列新AI功能。这些功能包括通过语音控制应用内的个性化操作、语音备忘录转录和总结、网站快速回顾和通知、自动消息回复、高级照片编辑以及 AI 生成的表情符号等。新的 Siri 系统将首先支持苹果自家的应用,并计划涵盖数百个不同的命令。苹果保护隐私方式曝光,虚拟黑盒、机密计算、自研高端芯片:苹果计划在其服务器上使用一种虚拟黑盒技术来处理AI应用程序的数据,这种黑盒甚至对公司内部员工都不透明,从而确保数据处理的安全性和隐私性。这一策略的核心是苹果自研的高端芯片,这些芯片不仅具备高安全性,而且还将支持所谓的“机密计算”技术。它通过在服务器上创建一个隔离的环境来处理敏感数据,从而保护用户隐私。据悉,该项目在苹果内部代号为“ACDC”。OpenAI 董事会回应内部事件与 AI 监管担忧:OpenAI 董事会成员 Bret Taylor 和 Larry Summers 回应了前成员 Helen Toner 和 Tasha McCauley 的批评,强调 OpenAI 在安全性和能力上都是行业领导者,并已采取措施加强治理结构和安全监督。他们指出,外部审查驳斥了替换 CEO Sam Altman 的必要性,并表示 Altman 在所有相关问题上都非常透明。OpenAI 支持 AI 的有效监管,与全球政府官员进行了广泛对话,并成立了新的安全委员会,以改善治理结构。旨在监管人工智能的发展和使用,支持可信人工智能,同时防范人工智能风险。办公室由技术专家、律师、经济学家等140名成员组成,设有首席科学顾问和国际事务顾问,分为5个部门:AI与机器人技术监管与合规、AI创新与政策协调、AI安全、AI社会公益。此外,欧盟通过《人工智能法案》对人工智能进行全面监管,包括对人工智能风险等级的分类和禁止应用风险水平“不可接受”的人工智能。谷歌在马来西亚投资20亿美元,将建数据中心开发AI:谷歌近日宣布在马来西亚进行一项重大投资,总额高达20亿美元。这笔投资将涵盖多个领域,包括建立首座数据中心、设立新的谷歌云区域,以及深入推进人工智能领域的开发。除了拓展云计算服务外,谷歌还将致力于支持一项针对学生和教育工作者的人工智能素养计划,以推动当地的人工智能教育和应用。Gartner 预测 2024 年全球 AI 芯片收入将增长 33%:根据Gartner最新预测,2024年全球人工智能半导体收入预计将达到710亿美元,较2023年增长33%。生成式人工智能推动了数据中心对高性能AI芯片的需求。此外,AI加速器的价值预计将从2024年的210亿美元增长到2028年的330亿美元。预计到2026年底,100%的企业PC购买将是AI PC。AI半导体收入预计将继续以两位数增长,2024年将达到最高增长率。研究论文介绍了一种利用AI技术将不可编辑的PDF文件转换为可编辑文档的方法,该方法能够保留原始布局和设计。与市场上其他工具不同,这项技术能够保留文档的字体、颜色、布局和其他视觉元素,同时允许对文档进行编辑。Arm发布面向下一代旗舰手机AI功能的CPU和GPU架构:日本软银集团旗下的英国芯片设计公司Arm控股发布了面向旗舰智能手机AI功能的下一代CPU和GPU设计,包括Cortex-X925 CPU和Immortalis G925 GPU,以及其他中端和小核设计,并将提供软件工具,让开发人员更容易在采用Arm架构的芯片上运行生成式AI聊天机器人和其他AI代码。预计将在年底投入市场,首发机型或为vivo X200系列。此外,Arm还在为未来的Windows操作系统笔记本电脑提供支持。Mistral AI推出代码生成模型Codestral,支持80+编程语言:该模型专为提高软件开发效率而设计,参数220亿,支持超过80种编程语言,包括但不限于Python、Java、C、C++等主流语言,以及Swift、Fortran等特定领域语言。Codestral能够理解自然语言指令,快速完成编程任务,如编写代码、生成测试用例和补全部分代码。OpenAI和《大西洋月刊》、Vox Media签订许可和产品协议:根据该协议,OpenAI 可以获得出版商的存档内容授权,以训练其人工智能模型,并允许出版商利用OpenAI技术支持其新闻产品。该笔交易为 OpenAI 寻找可信内容以训练算法和为聊天机器人提供信息的工作提供更多动力,也使其免于承担版权责任。OpenAI首席技术官称生成式AI带来的经济影响才刚刚开始:Murati表示,OpenAI最新的GPT-4o模型可以帮助用户生成文本、演示文稿和视频等内容,使用起来更简便,这也正在推动这个模型的使用。她说,人们越来越多地使用AI工具来完成编码、写作和行政工作等任务。“我们还没有完全认识到这将对企业和工作产生的影响,因为才刚刚开始,”她说。“但到目前为止,我们看到的是,在很短的时间内这些AI系统已经作为协助者进入了工作情景。”Product Hunt 热榜,多代理自动化平台crewAI
crewAI是一个多代理自动化平台,旨在简化AI代理的开发和部署。它提供了一个强大而简单的方法来自动化各种工作流,并且可以与多种AI模型和服务提供商(如OpenAI、Google、Azure、HuggingFace等)兼容。crewAI还注重隐私和安全性,确保每个代理在独立的VPC中运行。GitHub Trending 热榜,本地硬盘文件组织器LlamaFS
LlamaFS是一个自组织文件管理器,能够根据文件内容和时间等已知约定自动重命名和组织文件。它支持多种文件类型,包括图片和音频文件。LlamaFS运行在批处理模式和交互式守护模式下,能够快速处理文件操作并提供友好的用户界面。此外,LlamaFS还具有隐私模式和快速推理能力,确保用户数据的安全和系统运行的高效性。🔗https://github.com/iyaja/llama-fs1.ViViD:视频虚拟试穿的扩散模型技术
阿里巴巴元境团队推出ViViD(Video Virtual Try-on using Diffusion Models) 通过采用强大的扩散模型,解决了视频虚拟试穿的复杂任务。研究团队设计了一种服装编码器,用于提取细粒度的服装语义特征,确保每一个细节都能被准确捕捉并注入到目标视频中。为了实现空间和时间上的一致性,他们引入了轻量级姿势编码器,使模型能够学习服装与人体姿势之间的交互,并通过分层时间模块稳定扩散模型,生成连贯、逼真的视频。此外,团队还收集了一个新数据集,这是目前最大、服装类型最多样化且分辨率最高的虚拟试穿数据集。🔗https://becauseimbatman0.github.io/ViViD 2.Era3D:多视图图像生成技术
Era3D 是一种新型的多视图扩散方法,能够从单张图片生成高分辨率的多视图图像,通过引入基于扩散的相机预测模块和高效的行 wise 注意力机制,解决了相机先验不匹配、效率低下和分辨率不足的问题,大幅提高了多视图图像的质量和生成效率。Era3D 能够从多样化的单视图输入图片中重建出高质量、细节丰富的 3D 网格模型。🔗https://github.com/pengHTYX/Era3Da16z 刚刚公布 AI 实时语音助手的调研,19 张 PPT 发布关键创业洞见!
a16z 发布了一份关于实时对话型语音 AI 的详细报告,涵盖理念、技术栈、应用场景及市场机会。报告认为,企业可以通过 AI 语音助手降低成本,消费者则能享受到近似人类的服务体验。目前市场刚刚兴起,赢家尚未出现。- 市场机遇:AI 语音代理(AI Voice Agents)正处于重塑电话通话的黄金时期。通过应用这些技术,企业能够节省时间和成本,并提供一致且合规的客户体验;消费者则可以享受无需支付高额人力成本的服务。
- 技术栈:构建语音代理需要的技术包括语音识别(ASR)、大型语言模型(LLM)、文本到语音(TTS)、情感引擎和对话引擎。报告比较了全栈平台与自行组装技术的优缺点,强调了选择合适技术解决方案的重要性。
- B2B 应用:AI 语音代理正在从传统电话菜单树(IVR)和第一代 LLM 向更加灵活和精确的第二代 AI 过渡,特别是在医疗保健和客户支持等垂直领域。
- B2C 挑战:消费者语音代理需要更高的产品体验标准,才能吸引用户持续使用。这些代理不仅能替代昂贵或难以获取的人类服务,还可能创造全新对话体验。
- 创业建议:a16z 鼓励创业者在特定领域内进行深度定制和调优,并提供市场地图和潜在领域玩家的分析。他们还建议创始团队与投资者合作,实现产品快速迭代和市场推广。
B2B Agents 的一些关键特征
B2C 市场架构图
目前 AI 语音助手市场上的头部玩家
🔗https://gamma.app/docs/a16z-Real-Time-Conversational-Voice-AI--m3v486p98gt7jol?mode=present#card-yw88ld85marzgan本文产品编辑 zhumaterialism 深耕于AIGC知识领域的应用研究,期待与同行及感兴趣的读者交流思想、分享见解。欢迎添加以便深入探讨,共同推动行业进步。欢迎开发者主动联系提交产品,一起探索AI在各领域的创新应用,携手前行。