2、Meta前副总裁创办AI教育公司Sizzle AI3、OpenAI推出GPT-3.5 Turbo微调功能5、微软或于9月21推出Windows应用AI新功能7、VMware联手英伟达开发面向企业的私有AI平台9、联发科将联合Meta推出终端设备生成式AI应用17、炎黄盈动推出对话式应用搭建平台AI Copilot20、Hugging Face将获Salesforce 2亿美元投资21、老虎环球以6300万美元出售部分Cohere股份24、DeepMind发布提高翻译质量的算法ReST26、钉钉开放AI PaaS底座 AI版商业定价19800元起27、钉钉:软件付费企业达10万家 小微企业占58%28、清华联合字节开源听觉大语言模型SALMONN33、韩国SK电讯成为AI开发商Persona AI第三大股东34、高盛:全球AI投资规模2025年或接近2000亿美元38、YouTube将向艺术家付费以合作生成式AI产品
Meta于当地时间8月22日开源发布了AI翻译模型SeamlessM4T,能转录和翻译数百种语言的语音和文本,并开源了翻译数据集SeamlessAlign。Meta称,这是迄今为止最大的开放多模式翻译数据集,覆盖挖掘的语音和文本对齐总计27万小时。在进行鲁棒性测试时,与当前最先进的模型相比,SeamlessM4T在语音转文本任务中针对背景噪声和说话人变化的表现更好,平均分别提高了37%和48%。Demo地址:
https://seamless.metademolab.com/
GitHub开源地址:
https://github.com/facebookresearch/seamless_communication
2、Meta前副总裁创办AI教育公司Sizzle AI据The Information今日报道,Meta前AI副总裁杰罗姆·佩森蒂(Jerome Pesenti)近日创办了一家AI教育公司Sizzle AI,专注于利用AI帮助学生学习。根据周二的公司公告,Sizzle AI在教育领域风投公司Owl Ventures领投的一轮融资中筹集了750万美元的种子资金。3、OpenAI推出GPT-3.5 Turbo微调功能OpenAI于当地时间8月22日宣布推出GPT-3.5 Turbo微调功能和API更新,并将于今年秋天推出GPT-4微调版本。开发人员可以自定义更适合其所需用例的模型,并大规模运行这些自定义模型。早期测试表明,GPT-3.5 Turbo的微调版本在某些细分任务上可以匹配甚至超越GPT-4。OpenAI称,传入与传出微调API的数据不会被用来训练其他模型。此外,OpenAI更新了GPT-3模型,推出babbage-002和davinci-002作为GPT-3基础模型ada、babbage、curie和davinci的替代品,这些模型将于2024年1月4日关闭。OpenAI于8月22日在其社交媒体X上宣布ChatGPT自定义指令功能向欧盟和英国开放,该功能可以让用户对机器人设置一些特定的规则和条件,来控制机器人的行为和输出。此前,OpenAI曾于8月10日宣布该功能面向除欧盟和英国外所有用户免费开放。5、微软或于9月21推出Windows应用AI新功能据Windows Central 8月22日报道,微软正在将AI功能整合到Windows 11的应用程序中,包括照片、截图工具和画图等。据称,新功能可能包括识别照片中的对象或人物,并能够剪切这些元素粘贴到其他地方;识别屏幕截图、照片中的文本;在画图应用中用文本生成图像等。微软或将在9月21日举办活动发布新的Surface硬件,并进一步讨论Windows中的AI应用。根据IBM 官方消息,IBM于8月22日宣布推出生成式AI辅助产品watsonx Code Assistant for Z,将有助于在IBM Z计算机上更快地将古老的编程语言COBOL转换为Java。该产品基于一个200亿参数的大语言模型实现,将于9月11日至13日在拉斯维加斯举行的IBM顶级技术学习活动TechXchange期间进行预览,并于2023年第四季度全面上市。IBM Z是IBM推出的一系列大型机,运行Linux、z/OS等系统,可以不加修改地运行许多老旧的计算机应用程序。7、VMware联手英伟达开发面向企业的私有AI平台8月22日,VMware和英伟达宣布合作推出面向企业的AI平台VMware Private AI Foundation with NVIDIA,并计划于2024年初发布。该平台提供各种集成式AI工具,将使企业能够创建供内部使用的私有模型,并运行各种生成式AI应用,如智能聊天机器人、助手、搜索和摘要等。作为全集成式解决方案,该平台采用英伟达提供的生成式AI软件和加速计算,基于VMware Cloud Foundation构建,并针对AI进行了优化。VMware Private AI Foundation with NVIDIA将得到戴尔、慧与和联想的支持。这三家企业将率先提供搭载英伟达L40S GPU、BlueField-3 DPU和ConnectX-7智能网卡的系统,这些系统将加速企业LLM定制和推理工作负载。据路透社报道,英伟达股价于周二(8月22日)创下历史新高,在开盘几分钟后达到481.87美元,下跌1.1%,突破7月14日创下的480.88美元的历史高点。分析师称,英伟达在用于生成式AI等服务的芯片市场上占据主导地位,预计在周三公布业绩时,第三季度收入将增长110%,达到125亿美元。9、联发科将联合Meta推出终端设备生成式AI应用联发科今日于官网上宣布,公司正在与Meta的下一代开源大语言模型(LLM)Llama 2密切合作,将利用Meta的LLM以及联发科最新的APU和NeuroPilot AI平台,构建一个完整的边缘计算生态系统,以加速智能手机、物联网、汽车、智能家居和其他边缘设备上的AI应用开发。据称,基于Llama 2的AI应用将在搭载下一代旗舰SoC的智能手机上推出,计划于今年年底上市。8月22日,火山引擎于“视象新生”主题火山引擎视频云&AIGC大会上发布了自研视频编解码芯片,可以根据视频场景,提供不同的算力支持;携手英伟达发布多媒体处理框架BMF(Babit MultiMedia Framework),并全面开源,包含BMF框架层整体开源、9个开箱即用案例、20+API调用范例,旨在帮助企业和开发者将各类视频的原子能力与方案做到优势互补、协同工作和快速落地。8月21日,中国人工智能学会等联合主办的Engineering大讲堂暨“智行中国”第五期系列论坛在浙江大学举行。论坛上,浙江大学联合高等教育出版社、阿里云等发布了基于通义千问7B(70亿参数)模型训练的智海-三乐教育垂直大模型,该模型已在阿里云灵积平台(DashScope)上线,对外提供API服务;智慧司法技术总师系统、浙江大学、上海交通大学与阿里云等联合发布了行业首个《法律大模型评估指标和测评方法(征求意见稿)》,涵盖法律大模型能力体系、评估指标、测评方法、典型应用场景等内容,适用于法律大模型系统测试的设计和实施等任务场景,旨在推动法律大模型的研发、评测和应用的规范化。据机器之心报道,阿里达摩院原自动驾驶负责人陈俊波提出了一个名为“LPLM”(Large Physical Language Model)的具身智能大模型,并基于该模型完成了其第一款产品:有鹿智能清洁机器人,将在即将到来的杭州亚运会上亮相。据称,该款机器人实现了对语言语义、物理环境及行为意图的融合理解,支持随叫随到的清扫模式,能在充满行人、车辆的园区交互博弈环境中安全穿行,功耗仅50瓦。陈俊波在与机器之心的对谈中透露,他要做的并不是某一款机器人,而是一个放到任何传统自动化设备上都能正常运转的通用机器人“脑袋”,这个“脑袋”可以跨模态、跨场景、跨行业,具有极强的环境适应性。RISC-V中国峰会今日在北京召开。会上,平头哥发布首个自研RISC-V AI平台,通过软硬件深度协同,较经典方案提升超8成性能,支持运行170余个主流AI模型,推动RISC-V进入高性能AI应用时代。平头哥宣布玄铁处理器全新升级,C920首次加入Vector1.0,C907将实现Matrix扩展,执行GEMM计算较Vector方案可提速15倍。此外,平头哥更新自研一站式AI部署套件HHB,在典型网络性能比第三方工具平均提升88%,并增加支持运行Transformer、TensorFlow、PyTorch等170余个主流框架AI模型。基于此,平头哥发布了首个面向多媒体AI增强场景的RISC-V全栈软硬件平台。该平台将RISC-V扩展性的新型Vector、Matrix及第三方硬件进行算力抽象,接入OpenCV与CSI-NN等弹性计算库,深度融合多媒体处理流程,形成面向业务的流水线设计,方便用户在流水线的不同步骤上进行AI增强优化,为检测、分类、跟踪和超分等各类应用提速。这一平台也获评“2023RISC-V中国峰会新成果”。据经济观察网报道,8月22日晚百度发布第二季度财报后,百度CEO李彦宏在财报电话会议上称,年底百度将推出文心大模型4.0版本。文心一言目前还没有正式上线,仍在内测中。李彦宏称,百度正等待监管部门批准,目前还没有具体上线时间,但他对监管环境非常乐观。百度于22日发布截至2023年6月30日的第二季度财报。财报显示,百度第二季度实现营收341亿元,同比增长15%;百度智能云第二季度实现营收45亿,同比增长5%。根据IDC发布的《2022年中国公有云市场报告》,百度智能云在中国AI公有云服务市场份额中连续四年第八次排名第一;今年8月,飞桨平台开发者数量超过800万。8月18日,“2023世界机器人大会——机器人标准化和关键技术论坛”在北京召开。会上,全国机器人标准化技术委员会宣布成立人形机器人标准化工作组,并授予科大讯飞、小米集团、之江实验室等人形机器人标准化工作组副组长单位,共同推动国家人形机器人标准化工作建设,助力机器人产业高质量发展。17、炎黄盈动推出对话式应用搭建平台AI Copilot据AI低代码厂商炎黄盈动微信公众号发文,8月22日,炎黄盈动推出AI Copilot,采用自然语言以对话交互方式,使AI能够更好地理解用户的需求,并生成贴合用户需求的数字化应用,现已对外开放预约体验通道。据昆仑万维微信公众号发文,昆仑万维于今日正式推出融入大语言模型的天工AI搜索引擎,并开启内测申请。据称,天工AI搜索即将具备图像、语音等多模态搜索能力。内测地址:
https://search.tiangong.cn/
在8月19日的2023中国算力大会上,宁夏发布全国首个由政府主导建设的AI芯片适配基地。大会期间,昆仑芯携两代芯片系列产品亮相,成为首批加入AI芯片适配基地建设的头部企业。昆仑芯前身为百度智能芯片及架构部,于2021年4月完成独立融资,首轮估值约130亿元,专注打造拥有通用性、易用性和高性能的通用AI芯片。目前,昆仑芯已实现两代通用AI芯片系列产品的量产及落地应用,在互联网、智慧工业、智慧交通、智慧金融等领域均有规模部署。20、Hugging Face将获Salesforce 2亿美元投资据The Information 8月22日报道,CRM(客户关系管理)巨头Salesforce正在领投Hugging Face的一轮融资,约2亿美元。Hugging Face是帮助企业使用和存储AI软件的初创公司,估值超过40亿美元。21、老虎环球以6300万美元出售部分Cohere股份据The Information 8月22日报道,老虎环球基金将以约6300万美元的价格出售2.1%的Cohere股份,相当于其初始投资金额,并保留约5%的股份。Cohere目前的估值约为30亿美元。Cohere曾于今年6月宣布在新一轮C轮融资中筹集2.7亿美元,估值为22亿美元,投资者包括英伟达、甲骨文和Salesforce等。据路透社报道,挪威电信公司Telenor于8月22日宣布,已聘请谷歌云常务董事Amol Phadke担任首席技术官(CTO),以加强其AI业务。Phadke最近负责谷歌云电信业务,此前曾在英国电信、阿尔卡特朗讯和埃森哲的网络服务部门工作。Telenor自2021年起与谷歌云合作,对其全球运营进行数字化,探索共同为客户提供服务的方式,这是其正在进行的数字化转型计划的一部分。据金融时报8月22日报道,近日,英国数字、文化、媒体和体育部的官员已致函科技企业高管,认为科技公司在没有达成许可协议的情况下,一直利用其新闻报道等来训练聊天机器人,他们对版权等信息表示担忧。24、DeepMind发布提高翻译质量的算法ReST据机器之心报道,谷歌DeepMind于8月21日发布论文,提出一种使LLM与人类偏好对齐更简单的算法ReST(Reinforced Self-Training)。不同于RLHF(基于人类反馈的强化学习)使用人类反馈改进语言模型,ReST通过生成和使用离线数据进行训练,从而使得LLM与人类偏好保持一致。研究团队表示,虽然ReST可用于所有生成任务,但本文的重点是机器翻译。研究者在机器翻译任务上进行了实验,测试基准包括IWSLT 2014、WMT 2020和Web Domain。结果表明,ReST可以极大地提高翻译质量。论文地址:https://arxiv.org/pdf/2308.08998.pdf
据The Information报道,Meta将于周四(8月24日)推出开源代码生成AI模型Code Llama。该模型可在开发人员输入代码时自动向他们推荐代码,旨在让公司更容易创建AI助手。26、钉钉开放AI PaaS底座 AI版商业定价19800元起钉钉总裁叶军在8月22日举办的2023钉钉生态大会上公布了全面智能化的最新进展:已有17条产品线、55个场景全面接入大模型,完成智能化再造;同时面向生态伙伴和客户开放智能化底座AI PaaS,下接大模型,上连用户需求。钉钉方面透露,其生态伙伴和企业可以基于AI PaaS开发各类AI应用。叶军现场实景演示了基于AI PaaS和生态伙伴共创的新产品“数字员工”,以及会议、点餐、教育等多种场景、行业的AI解决方案。对于备受关注的大模型落地应用场景的收费问题,钉钉也给出了明确的方案:钉钉专业版年费9800元基础上,增加10000元即可获得20万次大模型调用额度;在专属钉钉年费基础上,增加20000元即可获得45万次大模型调用额度。27、钉钉:软件付费企业达10万家 小微企业占58%钉钉总裁叶军在8月22日举办的2023钉钉生态大会上宣布:截至2023年3月末,钉钉软件付费企业达10万家,其中,小微企业占比58%,中型企业占比30%,大型企业占比12%。钉钉ARR(年度经常性收入)远超半人马公司1亿美元评估标准,仅软件订阅式GAAP收入也已经明显超过这个数字。28、清华联合字节开源听觉大语言模型SALMONN据新智元报道,清华大学电子工程系与字节跳动火山语音团队合作,于上周推出一款认知导向的开源听觉大语言模型SALMONN(Speech Audio Language Music Open Neural Network),该模型不仅能够感知和理解各种类型的音频输入,还涌现出多语言和跨模态推理等高级能力。目前SALMONN能够胜任英语语音识别、英语到中文的语音翻译、情感识别、音频字幕生成、音乐描述等语音和音频任务,同时涌现出多种在模型训练中没有专门学习过的多语言和跨模态能力,涵盖非英语语音识别、英语到(中文以外)其他语言的语音翻译、对语音内容的摘要和关键词提取、基于音频的故事生成、音频问答、语音和音频联合推理等任务。Demo地址:
https://bytedance.githGithub开源地址:
https://github.com/bytedance/SALMONN/
证券时报e公司讯,云从科技于8月21日发布从容大模型1.5版本,该版本包含十亿级、百亿级、千亿级多种模型规格,实测性能在全球大模型综合性考试评测(C-Eval)中位居百亿级第1,总榜单第4。为解决大模型落地难题,从容1.5版本的重点是参数量为130亿的行业大模型,该模型从千亿大模型中蒸馏产生,在52类测试指标中有44类超过ChatGPT、29类超过GPT-4。据36氪8月22日报道,工业AI预测性维护公司频率探索近日完成数千万元A轮融资,本轮投资由涌铧投资领投,常州高新投跟投,融资资金将主要用于产品研发、生产线建设与市场拓展。频率探索成立于2021年,是一家工业AI预测性维护公司。公司掌握了大量的工业设备机理研究数据及信号分析诊断方法,能够为设备故障提供早期诊断、故障量化、寿命预测及智能运维服务。据工信微报微信公众号8月22日发文,工信部等四部门近日联合印发《新产业标准化领航工程实施方案(2023─2035年)》。方案提出,聚焦新一代信息技术、新能源、民用航空等8大新兴产业,以及元宇宙、人形机器人、生成式人工智能等9大未来产业,统筹推进标准的研究、制定、实施和国际化。据彭博社报道,韩国互联网巨头Naver将于周四(8月24日)在首尔举行生成式AI产品发布会,计划推出聊天机器人CLOVA X、生成式AI搜索服务Cue以及其他面向企业用户的服务,均基于其HyperCLOVA X大模型。33、韩国SK电讯成为AI开发商Persona AI第三大股东据The Korea Herald报道,韩国最大的电信运营商SK电讯(SK Telecom)于8月21日宣布成为AICC(智能联络中心)开发商Persona AI的第三大股东,双方将合作开发改善企业自动化客户服务设施的产品。据悉,Persona AI拥有自研的自然语言处理引擎,曾推出韩国首个订阅型AICC服务。34、高盛:全球AI投资规模2025年或接近2000亿美元财联社8月22日电,根据高盛研究部的数据,当前AI投资正迅速升温,可能对GDP产生很大影响。高盛研究部的经济学家Joseph Briggs和Devesh Kodnani在报告中指出,生成式AI具有巨大的经济潜力,在广泛使用后十年内每年可提高全球劳动生产率1个百分点以上,全球的生成式AI投资规模到2025年或将达到2000亿美元。据The Verge 8月22日报道,《纽约时报》屏蔽了OpenAI的网络爬虫,其robots.txt页面控制着为索引互联网而构建的自动化机器人的外观,现在明确禁止OpenAI的 GPTBot。这意味着 OpenAI 无法使用该出版物的内容来训练其人工智能模型。根据互联网档案馆的Wayback Machine,《纽约时报》似乎早在8月17日就阻止了该爬虫。据路透社报道,联合国在周一(8月21日)发布的一项研究表明,生成式AI可能不会完全接管大多数人的工作,而是会自动化他们的部分职责,但文职人员可能面临风险,其工作内容大约四分之一的任务高度暴露于潜在的自动化。据机器之心报道,图灵奖得主Bengio等人于8月21日发布论文深入探讨了当前主流的意识科学理论以及构建有意识的人工智能系统的可能性。在论文中,他们得出结论:目前,没有哪个人工智能系统是有意识的,包括谷歌的PaLM-E等前沿具身智能研究,但构建有意识的人工智能系统没有明显的障碍。论文地址:
https://arxiv.org/pdf/2308.08708.pdf
38、YouTube将向艺术家付费以合作生成式AI产品据华尔街日报8月22日报道,环球音乐集团和YouTube计划通过向艺术家支付费用的方式在AI生成内容中进行合作,目前已邀请美国歌手弗兰克·辛纳屈(Frank Sinatra)的遗产继承人及环球音乐的其他艺人,包括乡村歌手罗珊·卡什(Rosanne Cash)、作曲家马克斯·李希特(Max Richter)和说唱歌手尤·高蒂(Yo Gotti)等。YouTube此项计划中的艺术家将能够优先体验正在开发的AI产品,并向视频服务提供反馈。科技日报北京8月21日电,日本科学家开发出一种先进的AI模型,能利用患者的胸部X射线影像准确估计其实际年龄。当发现估计年龄与真实年龄出现较大差异时,AI还可揭示患者罹患慢性病的情况。研究结果发表于最新一期《柳叶刀·健康长寿》杂志。在2008至2021年间,研究团队共从36051名接受体检的健康人中收集了67099张胸透照片。所开发的模型显示,AI估计的年龄与实际年龄之间的相关系数为0.95。通常相关系数达到0.9以上会被认为准确率非常高。团队还从另外两个机构的病患处收集了34197张胸部X射线照片。结果显示,AI估计年龄与患者实际年龄之间的差异与高血压、高尿酸血症和慢性阻塞性肺病等多种慢性疾病呈正相关。(本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。)
9月14-15日,2023全球AI芯片峰会(GACS 2023)将登陆深圳。清华大学教授、中国半导体行业协会副理事长、IEEE Fellow魏少军,上海交通大学计算机科学与工程系教授梁晓峣,NVIDIA 解决方案与架构技术总监张瑞华,AMD人工智能事业部高级总监王宏强,亿铸科技创始人、董事长兼CEO熊大鹏,后摩智能联合创始人、研发副总裁陈亮等20+位嘉宾已确认参会和演讲。欢迎报名。