3、谷歌医学AI登Nature 临床准确率超92%10、商汤绘画大模型击败Stable Diffusion XL13、微软Windows 11应用商店上线AI中心14、Adobe Firefly开放超100种语言输入19、联合国教科文组织:AI驱动的神经技术需要监管23、AI语音创企Resemble AI融资800万美元
当地时间7月12日,马斯克新成立的AI公司xAI新网站上线(https://x.ai/),据称旨在“理解宇宙的真实本质”。xAI网站显示,该团队将由马斯克领导,团队中的许多高管曾在顶尖AI公司工作,包括谷歌旗下的DeepMind、微软公司和特斯拉公司,以及多伦多大学等学术机构。此外,该公司与马斯克旗下的实体公司X Corp独立,但将与X(Twitter)、特斯拉和其他公司密切合作。xAI团队将于7月14日举行Twitter Spaces聊天,听众可以与团队见面并向他们提问。据悉,马斯克曾参与创建OpenAI,但2018年离开OpenAI后,他经常公开批评该公司,尤其是批评该公司的营利性。同时,他曾在3月份呼吁暂停强大AI模型的训练。根据“网信中国”微信公众号,国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局近日公布《生成式人工智能服务管理暂行办法》(简称《办法》),自2023年8月15日起施行。根据《办法》,国家坚持发展和安全并重、促进创新和依法治理相结合的原则,采取有效措施鼓励生成式人工智能创新发展,对生成式人工智能服务实行包容审慎和分类分级监管,明确了提供和使用生成式人工智能服务总体要求。同时,《办法》提出了促进生成式人工智能技术发展的具体措施,明确了训练数据处理活动和数据标注等要求;规定了生成式人工智能服务规范,明确生成式人工智能服务提供者应当采取有效措施防范未成年人用户过度依赖或者沉迷生成式人工智能服务,按照《互联网信息服务深度合成管理规定》对图片、视频等生成内容进行标识,发现违法内容应当及时采取处置措施等。此外,《办法》还规定了安全评估、算法备案、投诉举报等制度,明确了法律责任。3、谷歌医学AI登Nature 临床准确率超92%根据学术顶刊《自然》(Nature)官网,谷歌的医学大语言模型Med-PaLM于近日正式在《自然》杂志上发表。根据该杂志的声明,该模型回答医学问题的准确率为92.6%,符合科学共识,略低于现实生活中医学专业人士92.9%的正确率。研究还发现,模型的反应中只有5.8%可能造成伤害,低于临床医生达到的6.5%。该杂志也指出,尽管这些结果看起来很有希望,但医学领域很复杂,还需要对模型进一步评估,特别是在安全性、公平性和偏见方面。据悉,谷歌于2022年末推出该模型,并在今年3月推出迭代版本Med-PaLM 2。根据《华尔街日报》此前爆料,其最新版本已进入部分医院进行测试。根据谷歌官方博客,谷歌将在欧洲及巴西推出Bard聊天机器人。据悉,谷歌原计划于6月在欧洲发布Bard聊天机器人,但由于爱尔兰的监管机构要求该公司具备足够的保障措施,相关计划被推迟。谷歌本周四宣布,它已经满足了爱尔兰监管机构的要求,收紧了Bard聊天机器人的隐私设置以提高透明度,方便用户知道他们的数据如何被使用,并给予他们更多的控制权。此外,谷歌还扩展了Bard的功能,从周四起,聊天机器人将提供包括中文在内的40多种语言版本,谷歌还增加了对谷歌智能镜头的支持、语音聊天机器人的响应、固定和重命名对话以及在仅限英语服务的提示中使用图像的功能。据英国《金融时报》爆料,Meta准备发布其AI模型的商业版本,允许企业在该技术的基础上构建定制软件。这将使Meta能够与OpenAI和谷歌展开竞争。目前这款软件由大模型驱动,可以创建文本、图像和代码。Meta今年早些时候面向研究人员和学者发布了自己的语言模型LLaMA,但新版本将更广泛地面向公司,并可进行定制化。一位知情人士预计新版本很快就会发布。今日,京东大模型“言犀”及言犀AI计算平台正式亮相。据悉,言犀大模型训练时融合了70%的通用数据与30%数智供应链原生数据,已经在实体属性抽取准确率、生成式多轮对话、多轮稳答知识检索旅率等多方面超过传统Transform模型。言犀AI开发计算平台则助用户只用五步就能将通用大模型转向产业模型,支持多家通用大模型,将在8月上线,现已开启预约。据外媒The Information报道,OpenAI CEO Sam Altman在接受采访时称自己在OpenAI没有任何股权,因为他不需要钱。但他向Reddit、Stripe和Asana等公司以及Cerebras和Humane等AI初创公司进行了约400笔投资。据《华尔街日报》报道,Oklo是一家由OpenAI的CEO Sam Altman支持的核裂变初创公司,该公司高管周二宣布,Oklo计划通过与Altman旗下的特殊目的收购公司SPAC合并上市。该交易的估值为8.5亿美元。据悉,Oklo正在开发一种小型模块化核反应堆设计方案,并计划向竞争激烈的电力市场出售电力,包括通过风能和太阳能开发商经常与希望购买无碳电力的企业和工业公司签订的那种协议。根据谷歌官方博客,谷歌近日将其5月推出的笔记应用Project Tailwind更名为“NotebookLM”。据悉,NotebookLM从源头创建了一个熟悉用户信息的个性化AI,它可以被当做虚拟研究助理,能够总结事实,解释复杂想法并集思广益新想法。该应用即刻向美国的一小部分用户开放,据称仍需要用户反馈以完善产品。谷歌承诺不会使用收集到的任何数据来训练新的AI模型。10、商汤绘画大模型击败Stable Diffusion XL商汤大模型团队近日提出名为RAPHAEL文本条件图像扩散模型,该模型可以生成高度艺术化的图像,这些图像准确地描绘了包含多个名词、形容词和动词的文本提示,而且生成速度极快。综合实验表明,RAPHAEL在图像质量和审美吸引力方面均优于Stable Diffusion XL,DALL-E2、Deep Floyd等模型。据称,该模型在日式漫画、现实主义、赛博朋克、水墨插画等多种风格的图像切换上展现出卓越的表现。同时,具有30亿个参数的单一模型在1000个A100 GPU上训练了两个月,在COCO数据集上实现了最先进的零样本FID分数6.61。此外,RAPHAEL在ViLG-300基准的人类评估中显着超过了同类产品。论文地址:
https://arxiv.org/pdf/2305.18295.pdf
该研究还提供了基于RAPHAEL的artist v0.3.0 beta模型的免费试玩链接:
https://miaohua.sensetime.com/zh-CN/
根据美国计算机协会(ACM)官网,该协会的全球技术政策委员会本周二发布了《生成式人工智能技术的开发、部署和使用原则》,该原则由ACM的美国技术政策委员会和欧洲技术政策委员会联合制定并通过。据悉,该声明概述了八项原则,旨在促进有关生成式AI和其他AI技术的公平、准确和有益的决策。其中四项原则专门针对生成式AI,包括部署和使用的限制和指南、所有权、个人数据控制、可纠正性;另外四项原则改编自TPC 2022年的《负责任的算法系统原则》,包括透明度、可审计性和可争议性、限制环境影响、更高的安全性和隐私性。据外媒报道,英伟达本周三宣布将向AI药研上市公司Recursion投资5000万美元,加速Recursion人工智能模型的训练。Recursion将使用23K+TB数据集在英伟达云平台上训练模型。该股开盘时上涨了1倍多,周三收盘时涨幅达到创纪录的78%。在5月份,Recursion曾以8750万美元收购了AI驱动的药物发现领域的两家公司。该公司现在正在对其五种药物进行人体试验,其中一种候选药物正处于中期试验阶段,用于治疗由大脑小血管畸形引起的一种神经血管疾病。13、微软Windows 11应用商店上线AI中心微软官网显示,微软于昨日在Windows 11预览版应用商店发布AI中心。AI中心将重点展示一组来自第三方开发商和微软的精选AI应用程序。据悉,微软在5月份的Build大会上首次推出了这个新中心,并在大会上展示了微软商店中AI生成的应用程序评论摘要。14、Adobe Firefly开放超100种语言输入根据Adobe官方博客,该公司本周三宣布Adobe的AI图像生成器Firefly将提供包括中文在内的100多种语言输入提示。据悉,Adobe于今年3月推出Firefly,并将其训练数据限制为免版税图像,从而使该工具与Midjourney或DALL-E2等类似的AI图像生成器区分开来,据称这使其商业用途更加安全。据钛媒体报道,2023年上半年,在港交所排队的AI或数字化和智能化相关公司超过38家,包括英矽智能、黑芝麻智能、云知声等公司,共占整个港交所累计正在处理中的96家IPO公司的40%左右。据界面新闻报道,在近日召开的国家社科基金重点项目举行阶段性成果线上发布会上,中国人民大学研究团队与微点科技联合开发的“政研大模型(PSLLM-14B)”正式亮相。据悉,该模型基于Multi-Task Transformer架构,共计140亿神经网络参数,在政策文本分析挖掘任务中展现出良好的性能,具有“可信”、“可知”、“可用”三大特点。在实际部署的过程中,该模型会以插件化的形式融入现有的数字基础设施和政务系统。微点科技负责人鞠翔举例,该大模型可以作为政策文本分析和解读的智能数字辅助工具,帮助政策研究人员更快地获取政策信息,更准确地理解政策含义。近日,麻省理工大学李巨教授团队推出了一个专为实验科学家设计的AI助手CRESt,研究人员即使不具备编码经验,只需与CRESt交谈,便可利用自动化实验平台帮助自己做实验。CRESt的操作系统由用户界面、ChatGPT后端、主动学习、端执行器四部分组成,从前端产生的文本信息会被传输到ChatGPT后端,这允许将谷歌样式文档字符串中记录的Python函数转换为ChatGPT可识别的JSON格式,当ChatGPT发现必要时可以调用该格式。此外,它关闭了ChatGPT和本地Python函数之间的反馈循环,建议的函数将立即在本地执行,其返回值将被发送回ChatGPT。论文地址:
https://doi.org/10.26434/chemrxiv-2023-tnz1x据ThunderSoft中科创达官方公众号,智能操作系统供应商中科创达今日宣布与北京智源AI研究院共同成立“魔方未来联合实验室”。基于该实验室,双方将在大模型开发与应用创新等方面展开战略合作,促进AI技术在智能汽车、智能机器人、智慧工业、智能物联网等领域的应用落地。19、联合国教科文组织:AI驱动的神经技术需要监管据英国《金融时报》报道,联合国教科学和文化组织将在周四举行的科学和政治领导人会议上制定神经技术的“通用道德框架”。现在,神经技术将计算机与大脑连接起来,并越来越多地使用AI来分析神经活动。据悉,神经技术,包括用于诊断和治疗大脑相关疾病的植入物,正在开始改善残疾人的生活,但AI的引入,让这些程序可以读取人们的思想并存储神经数据。该组织称,神经技术的发展威胁到人权,因此需要进行全球监管。据外媒VentureBeat报道,在昨日的VentureBeat Transform 2023的炉边会议上,东北大学体验式AI研究所执行董事Usama Fayyad称,虽然大型语言模型和生成式AI取得了进步,但它们仍然严重依赖人类的监督和干预。他说,生成式AI是鹦鹉,它们听不懂自己在说什么,只是重复以前听到过的内容。据《科创板日报》报道,近日,AI创企reInvent AI宣布完成数千万美元首轮融资,由联想创投独家投资。reInvent AI专注于基础模型和通用人工智能(AGI),旨在打造面向行业的专业大模型。创始团队人员包括欧洲科学院院士、OpenAI GPT核心成员,和原SAP全球高级副总裁兼全球AI负责人等,还有Transformer论文原作者作为顾问。reInvent AI将在德国柏林和中国上海同时运营,其德国公司名为nyonic。天眼查App显示,华为技术有限公司近日申请注册了“华为云盘古”、“Huawei Cloud Pangu Models”文字及图形商标,国际分类为网站服务、社会服务,当前状态均为申请中。23、AI语音创企Resemble AI融资800万美元据外媒TechCrunch报道,AI语音创企Resemble AI昨日宣布,该公司在由Javelin Venture Partners领投、Craft Ventures和Ubiquity Ventures参与的A轮融资中筹集了800万美元。据悉,Resemble AI创立于2019年,目前在利用生成式AI克隆听起来逼真的声音。Resemble AI联合创始人兼CEO称,这笔资金将用于开发企业产品与扩充团队。智东西7月13日消息,据智源研究院官方公众号,智源统一多模态预训练模型Emu 正式开源。根据智源数据,Emu超越了此前DeepMind的多模态大模型Flamingo,刷新8项性能指标。模型能力覆盖图像与文本的生成及视频理解,更通用,能完成任意图生文以及文生图的多模态任务。
据悉, Emu建立了多模态统一学习框架,大量采用视频数据,最终得以实现对任意形式的多模态的上下文序列进行图文任意模态的补全,即对于任意模态进行下一步自回归预测。
论文链接:
https://arxiv.org/pdf/2307.05222.pdf
模型链接:
https://github.com/baaivision/Emu
Demo链接:
https://emu.ssi.plus/
(本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。)