OpenAI等推出AI语音翻译；百度发布首个量子领域大模型；微软或将用核电供能AI数据中心丨AIGC大事日报

科技

2023-09-26 15:09

09 / 26

全球AIGC产业要闻

1、ChatGPT将推出语音和图像输入功能

2、OpenAI发布视觉模型GPT-4V及其系统卡论文

3、Spotify合作OpenAI推出AI语音翻译功能

4、Getty合作英伟达推出生成式AI工具

5、微软招聘核技术经理或用核电供能AI数据中心

6、百度发布首个量子领域大模型及两大AI原生应用

7、合合信息等发布业内首个古彝文基础编码数据库

8、抖音上线地方方言AI自动翻译功能

9、中美多家机构联合发布大模型可解释性技术综述

10、潞晨与澜舟将合作打造企业级LLM解决方案

11、中国电信在深圳成立含AI软件业务数智公司

12、梅安森计划推出第一代矿山安全模型

13、耐能宣布完成9700万美元B轮融资

14、AI医疗公司惠每科技宣布完成超3亿元D轮融资

15、诺和诺德合作Valo 基于AI寻求CMD新疗法

16、诺基亚将在迪拜设实验室推动AI技术应用

17、木头姐：在AI方面有比英伟达更好的赌注

18、英国政府：AI对多边体系构成了“严峻考验”

1、ChatGPT将推出语音和图像输入功能

当地时间25日，OpenAI于官网宣布将在ChatGPT中推出新的语音和图像功能，允许用户进行语音对话、上传图像。该系列功能将在两周内于Plus和企业版推出，其中，语音功能将在iOS和安卓平台提供，图像功能将在所有平台提供。据介绍，新的语音功能由新的文本转语音模型提供支持，能够仅从文本和几秒的样本语音中生成类似人类的音频，OpenAI与专业配音演员合作创作了每一个声音，并使用开源语音识别系统Whisper将用户的口语转录为文本。图像理解由多模态GPT-3.5和GPT-4提供支持，这些模型将其语言推理技能应用于各种图像，例如照片、屏幕截图以及包含文本和图像的文档。

2、OpenAI发布视觉模型GPT-4V及其系统卡论文

当地时间25日，OpenAI于官网发布多模态视觉模型GPT-4V（Vision）系统卡论文。据介绍，GPT-4V使用户能指示GPT-4分析用户提供的图像输入，其训练于2022年完成，并在2023年3月开始提供早期访问系统。该系统卡概述了OpenAI如何为GPT-4部署视觉功能，并分析了GPT-4V的安全属性。

论文地址：

https://cdn.openai.com/papers/GPTV_System_Card.pdf

3、Spotify合作OpenAI推出AI语音翻译功能

据外媒The Verge报道，流媒体平台Spotify近日合作OpenAI，基于OpenAI的语音转录工具Whisper推出AI语音翻译功能，利用该工具将其他播客的英语剧集翻译成另一种语言，并以播客自己的声音合成版本再现。该功能目前已推出西班牙语翻译，并计划在未来几周内推出法语和德语翻译。

4、Getty合作英伟达推出生成式AI工具

近日，Getty Images合作英伟达推出一款生成式AI工具，基于英伟达的Edify模型，用户可根据Getty Images的授权照片库创建图像。该工具将与标准的Getty Images订阅分开定价，并且定价基于即时数量，但Getty未具体说明价格。Getty承诺，任何使用该工具并发布其商业图像的人都将受到法律保护。

5、微软招聘核技术经理或用核电供能AI数据中心

据IT之家报道，根据微软官网的一份招聘启事，微软正在考虑使用核电来运行其大型数据中心。该公司正在寻找一位“核技术首席项目经理”，此职位的任务是领导SMR（小型模块化反应堆）和微反应器集成的技术评估，为微软云和AI所在的数据中心提供动力。

6、百度发布首个量子领域大模型及两大AI原生应用

据百度微信公众号发文，9月23-24日，2023量子产业大会在安徽合肥召开。会上，百度量子计算研究所所长段润尧发布首个量子领域大模型，及百度量子助手和量子写作助手两大AI原生应用。他还发布了量子领域大模型白皮书，展望量子领域大模型的未来发展趋势和技术潜力。据段润尧介绍，该量子领域大模型是在文心一言基础上，使用量子领域高质量数据进行更有针对性的训练和优化而构建的量子领域大模型，能更好地理解量子知识，专业执行量子任务。

7、合合信息等发布业内首个古彝文基础编码数据库

近期，合合信息联合上海大学、华南理工大学发布业内首个古彝文基础编码数据库，该项目由合合信息与上海大学社会学院、华南理工大学文档图像分析识别与理解实验室共同推进，针对现有的《西南彝志》、云贵一带字符，通过智能图像处理、智能文字识别等AI技术开展统一编码，并于近期发布了业内首个古彝文基础编码数据库（简称“数据库”）。

在对7万6千字符的样本进行训练后，团队成功建立了包含上千个古彝文基础编码的数据库。在收集语料收集的过程中，研究人员使用了合合信息旗下扫描全能王“智能高清滤镜”功能，高效解决古彝文识别的版式检测、图像处理和文字识别等难题。对于污渍、残破的彝文古籍，收集者只需通过“智能高清滤镜”轻轻一扫，即可得到一张清晰、平整的图片。

通过API数据接口等形式，该数据库有望帮助高校研究人员、文化工作者、兴趣爱好者等人群快速找到古彝文在字典中的读音、汉语释义、用法，如同“大字典”一般，帮助人们降低古彝文书籍、文献阅读的门槛。

8、抖音上线地方方言AI自动翻译功能

据央广网报道，抖音于近期上线了方言自动翻译功能，创作者可以“一键”将粤语、闽语、吴语、西南官话、中原官话等方言视频转化出普通话字幕，方便公众观看。据介绍，抖音火山引擎技术团队采用了自研的自监督预训练模型和多语言翻译模型，实现了极少量标注数据条件下识别方言的能力，且训练效率提升一倍，有效提升了多语言翻译的性能，同时大幅度降低了模型训练的资源消耗。

9、中美多家机构联合发布大模型可解释性技术综述

据机器之心报道，近期，中美多家机构（新泽西理工学院、约翰斯·霍普金斯大学、维克森林大学、佐治亚大学、上海交大、百度等）联合发布了大模型可解释性技术的综述，分别对传统的Fine-tuning模型和基于Prompting的超大模型的可解释性技术进行了全面的梳理，并探讨了模型解释的评估标准和未来的研究挑战。

论文链接：

https://arxiv.org/abs/2309.01029

GitHub链接：

https://github.com/hy-zhao23/Explainability-for-Large-Language-Models

10、潞晨与澜舟将合作打造企业级LLM解决方案

据潞晨科技微信公众号发文，近日，北京潞晨科技有限公司（简称“潞晨科技”）与北京澜舟科技有限公司（简称“澜舟科技”）达成战略合作协议。潞晨科技将以Colossal-AI系统为基础，结合内存管理，多维并行，推理提速等先进技术，帮助澜舟科技更高效更快速地实现垂类模型落地，使孟子通用大模型、孟子行业大模型和孟子场景服务模型等孟子系列大模型更好地服务行业头部和标杆企业，共同推动AI大模型在多个领域的工程化产业应用和落地，积极助力各产业的数字化转型。

11、中国电信在深圳成立含AI软件业务数智公司

《科创板日报》26日讯，天眼查App显示，9月25日，中电信数智科技（深圳）有限公司成立，法定代表人为张宇峰，注册资本5000万人民币，经营范围含软件开发、智能控制系统集成、智能无人飞行器销售、可穿戴智能设备销售、5G通信技术服务、光通信设备销售、人工智能应用软件开发等。股权全景穿透图显示，该公司由中电信数智科技有限公司全资持股，后者为中国电信（601728）全资子公司。

12、梅安森计划推出第一代矿山安全模型

《科创板日报》26日讯，安全领域“物联网+”企业梅安森董事长马焰在接受《科创板日报》记者采访时表示，公司从去年开始利用华为盘古大模型和算力，对原有产品进行优化，目前已应用于项目中。梅安森与上海人工智能研究院共建矿山安全大模型联合实验室，计划尽快推出第一代针对细分领域问题的矿山安全模型，应用于矿山中，并逐步完善。

13、耐能宣布完成9700万美元B轮融资

据人工智能公司耐能微信公众号发文，今天，耐能宣布从和顺兴基金、富士康及全科科技等投资者处获得4900万美元的战略融资，使B轮融资总额达到9700万美元。本轮融资由维港投资领投，光宝科技、威刚科技、富士康及和顺兴基金等多家公司参投。此次资金，耐能将用于加速先进人工智能的推进，特别关注汽车领域轻量级GPT的解决方案。据悉，耐能目前为止的融资总额达到1.9亿美元。

14、AI医疗公司惠每科技宣布完成超3亿元D轮融资

据医疗AI解决方案提供商惠每科技微信公众号发文，今天，惠每科技宣布完成超3亿元人民币的D轮融资，本轮融资由钟鼎资本领投，润璋创投、苏州宜和等知名投资机构跟投，老股东启明创投继续投资。泰合资本担任本轮融资财务顾问。

15、诺和诺德合作Valo 基于AI寻求CMD新疗法

当地时间25日，知名生物制药公司诺和诺德（Novo Nordisk）于官网宣布与美国科技公司Valo Health合作，将利用Valo公司的Opal计算平台和患者数据集，以实现新型心脏代谢药物项目的发现和开发。Valo将获得一笔预付款和一笔潜在的近期里程碑付款，总额为6000万美元，并且有资格获得最多11个项目的里程碑付款，总额27亿美元，外加研发资金和潜在的特许权使用费

16、诺基亚将在迪拜设实验室推动AI技术应用

据外媒ET Telecom报道，诺基亚于当地时间周一宣布将在阿联酋迪拜设立一个“开放式创新”实验室，旨在推动中东非地区人工智能、机器学习等技术在云无线接入网（C-RAN）、私有无线网络、工业网络等领域的应用。

17、木头姐：在AI方面有比英伟达更好的赌注

据彭博社报道，被称作“女版巴菲特”的知名基金经理、方舟投资（ARK Invest）首席执行官“木头姐”Cathie Wood在慕尼黑的一次投资者会议上称，在人工智能的指数级增长方面，有比英伟达更好的选择，她强调了另外两家“不太明显的”AI软件公司UiPath和Twilio。据悉，Wood的旗舰基金ARK Innovation ETF在今年1月减持了英伟达股票，错过了该芯片制造商估值达到1万亿美元的大部分涨势。

18、英国政府：AI对多边体系构成了“严峻考验”

据英国《金融时报》报道，英国政府在近期举行的联合国大会上警告称，人工智能对多边体系构成了“严峻考验”，并声称正在寻求让包括中国在内的国家支持其监管该技术“社会规模”风险的愿景。上周，英国副首相Oliver Dowden和外交大臣James Cleverly在联合国大会期间接受英国《金融时报》采访时，为英国邀请中国参加人工智能监管峰会的决定进行了辩护，该峰会最初被描述为只包括“志同道合的国家”。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章