中国AI大模型地图发布;GPT研究烧掉30亿美金;美团正自研基础模型丨AIGC大事日报
在昨日举行的2023中关村论坛·人工智能大模型发展论坛上,科技部新一代人工智能发展研究中心发布《中国人工智能大模型地图研究报告》。报告显示,中国研发的大模型数量排名全球第二,仅次于美国;从国内大模型区域分布来看,北京、广东、浙江、上海处于第一梯队。
“从全球已发布的大模型分布来看,中国和美国大幅领先,超过全球总数的80%。美国近年来一直排名第一,中国从2020年起进入快速发展期,目前与美国保持同步增长态势。”中国科学技术信息研究所所长、科技部新一代人工智能发展研究中心主任赵志耘说。
人工智能和大模型论文作者统计表明,大模型学者指数排名国内前四的分别是:北京、江苏、广东、上海。报告的开源影响力地图显示,国内已有超过半数的大模型实现开源。高校和科研机构是开源主力,清华大学的ChatGLM-6B、复旦大学的MOSS、百度的文心系列大模型在开源影响力上位居三甲。
今日,吴恩达在知乎发文,呼吁“是时候抛开机器学习系统需要用到大量数据的刻板印象了”,大型预训练模型能使利用非常小的标记训练集构建可行系统变为现实。
现在,用很少的样本就可以构建和部署机器学习模型,快速构建和发布产品也越来越有希望——甚至可能不需要收集和使用测试集。他相信这将带来更多令人兴奋的应用,包括那些我们没有太多标记数据可用的应用。
5月28日,中国工程院院士、中国人工智能学会理事长戴琼海在中关村论坛上表示,算法大模型成本日趋高昂,GPT-3训练成本单次约500万美元,GPT系列研究投入累计超过30亿美元。并且模型日趋庞大,5年提升两万倍;任务日趋多样,一个模型开源处理多个任务。GPT-3训练数据约为《人民日报》45万年文字量。
2023中关村论坛期间,阿里云智能集团CTO周靖人谈道,以模型为中心的开发范式(MaaS)已成为行业标准,未来应用开发的整个链路都会基于这一理念来做。
去年11月,阿里云率先在业界提出“Model as a service”概念,并推出开源AI社区魔搭(ModelScope),进一步降低了AI开发的门槛。据介绍,半年间,魔搭社区模型总量已超过900个,总用户量超150万,模型总下载量超2000万。
在5月27日举行的2023中关村论坛“互联网3.0:未来互联网产业发展论坛”上,清华大学新媒体研究中心主任沈阳发表演讲。他坦言,ChatGPT的迅速成长,让他心里没底。“AI未来不可预知的一个现象。它到底会不会AI觉醒,我们搞不清楚。”
沈阳认为AIGC的发展将从跨模态走向元宇宙。他谈道,如果把猫的声音收集起来,通过大模型学习,有可能在3年内实现人猫对话,这已经超过了人机对话的范围。他预测,随着GPT的发展,借助AI分身,未来人类甚至可以脱离社交。
在上周五发表的ESG投资专栏文章中,瑞银集团分析师列出了采用生成式 AI 可能导致一系列道德问题的许多方式。例如AI生成的与监管机构、公司或公众人物相关的不准确信息可能会被广泛分享,并产生潜在的市场影响。
分析师警告说,AI的传播可能对金融市场造成“高度破坏”,因为该技术有助于发布虚假信息,并使得知识产权泄露的可能性更大。
鉴于此类风险,许多银行限制了生成式AI的使用。今年早些时候,美国银行、花旗银行、德意志银行、高盛集团、富国银行等禁止使用生成式AI工具。
智东西5月29日消息,据彭博社5月27日报道,得益于上周英伟达超预期的业绩预测,美股七大科技股,包括微软、Alphabet、亚马逊、Meta、特斯拉、苹果、英伟达,在5天内总市值增加了4540亿美元,拉动标普500指数连续第二周上涨。
自今年1月以来,这7家巨头的股价中位数上涨43%,几乎是标普500指数的5倍。市盈率为35倍,比市场水平高出80%。
据《纽约时报》报道,一位在美国纽约执业30年的律师在打官司时,在提交的一份10页辩护文件中引用了ChatGPT生成的6个虚假法院判决,结果惹祸上身,被发现无法找到这些引文。法官下令将在6月8日举行听证会,讨论可能的制裁措施。
上周四,这位律师提交了一份宣誓书,承认用过AI进行法律研究。他“非常后悔”依赖ChatGPT,说自己无意欺骗法庭,因为自己此前从未用过ChatGPT,不知道其内容可能是假的,甚至还要求ChatGPT核实这些案件是真实的,结果ChatGPT笃定打包票“都是真实的,可以再信誉良好的法律数据库中找到”。
今日,英伟达创始人兼CEO黄仁勋在台北电脑展COMPUTEX 2023主题演讲上展示了用于加速生成式AI开发的多个新系统、软件及服务。其中,多数产品由Grace Hopper超级芯片提供支持。
其发布内容包括:推出用于运行生成式AI的DGX GH200大内存超级计算机,宣布GH200超级芯片现已全面投产,英伟达自己的大规模AI超级计算机NVIDIA Helios将于今年上线,发布用于快速创建加速服务器的模块化参考架构NVIDIA MGX,与日本电信巨头软银合作推动5G、6G发展,发布专门用于提高以太网AI云性能和效率的网络平台NVIDIA Spectrum-X,推出NVIDIA Avatar Cloud Engine(ACE)游戏开发版,与全球最大的营销服务机构WPP合作打造生成式AI内容引擎等。
据界面新闻报道,5月27日,根据应用情报提供商data.ai最新报告,OpenAI的iOS版ChatGPT应用推出不到一周下载量已超过50万次。美国时间5月18日,OpenAI宣布推出iOS版ChatGPT应用。截至5月23日,该应用美国市场下载量达55万次。
5月27日,面壁智能联合知乎在“2023中国国际大数据产业博览会”上发布了最新的大语言模型成果。发布会上,面壁智能开源自研模型CPM-Bee 10B,并推出对话类模型产品“露卡”(Luca)。
CPM-Bee模型从零开始自主训练,基于Transformer架构,中英双语表现优秀,拥有百亿量级参数、万亿级高质量语料,并且配套 OpenBMB 大模型系统生态支持。该模型在中文的ZeroCLUE评测基准上位居中文大模型第一,在英文评测基准上效果与开源模型LLaMA相当。如想将模型用于商业用途,企业需实名邮件申请并获得官方授权证书。
以CPM-Bee作为基座模型,面壁智能推出了智能大语言模型产品“露卡”(Luca) 。“露卡”(Luca)能帮助人了解世界知识、处理数理逻辑、编写程序代码、激发创作灵感、获取信息、做出规划、解决问题,并拥有优秀的多模态理解能力,可以查找论文并生成摘要。“露卡”(Luca)将首先定向邀请部分用户先行试用并提供反馈,待产品进一步成熟,再对公众开放测试。
据新浪科技报道,360集团与创业黑马签订战略合作协议,双方将在AI大模型研发、城市产业落地、中小企业服务等领域展开全面合作。
在大模型联合研发方面,360将与创业黑马共同成立联合实验室,研发面向各个行业和不同场景的GPT解决方案,并基于360的基础大模型+黑马客户群行业模型及数据,构建起面向细分行业、也包括黑马自身科创企业在内的应用方案。
同时,双方将共同推进GPT联盟合作。联盟企业将一同联动算力、算法、数据、场景应用和上下游产业链,协同政府机构、AI研究机构、高等院校、企业和社会组织等,孵化和帮扶GPT独角兽企业、推动GPT技术发展。
5月25日,美团发布2023年第一季度业绩。在财报会议上,美团董事长兼CEO王兴谈道,目前美团的内部团队在致力于打造自研基础模型及相关应用程序,不便披露更多细节,只能说一切都还在进行之中。
据英国《金融时报》报道,韩国互联网搜索引擎巨头Naver计划向担心美国数据控制的外国政府提供其最新的类ChatGPT AI模型的定制版本。
Naver将为阿拉伯世界具有政治敏感性的国家以及西班牙和墨西哥等非英语国家开发本地化AI应用程序。这些国家的政府希望拥有根据其政治和文化背景定制的AI系统。
据泰伯网5月26日独家报道,泰伯网从多方获悉,百度飞桨平台(Paddle Paddle)产品负责人毕然将于近期离职。截至发稿,百度及毕然本人并未公开回应。据了解,离开百度后,他将加入2017年创立的时空大数据服务商土豆数据,出任CTO。有资深从业者表示,业界将进入遥感大模型实战人才争夺战。
资料显示,毕然本科毕业于北京邮电大学,博士毕业于中国科学技术大学,于2019年8月入职于百度,为百度杰出架构师、飞桨产品负责人,如今职级为P10。他所负责的“飞桨”深度学习平台,是百度AI技术体系的重要一环,支撑着文心大模型从开发训练到推理部署的整个流程。
微信扫码关注该文公众号作者