Redian新闻
>
五月最后一周的3个新话题,14个新产品与10篇最受关注的论文|真 AI

五月最后一周的3个新话题,14个新产品与10篇最受关注的论文|真 AI

公众号新闻

关注 AI,我们动真格的。

从 ChatGPT 到 GPT-4,再到诸多国产大语言模型, AI 技术发展与商业模式都在飞速进化。自成立第一天起,真格基金就是新技术与创业精神的坚定支持者。在过去的几年里,我们先后天使投资了格灵深瞳、云天励飞、地平线、来也、森亿等等许多 AI 技术相关的创业公司。

今年 3 月,我们设计并整理出“Z-Bench”,一个为非技术人员定性测试大模型对话产品的测试集,给大语言模型产品进行测评。并陆续发布了 7 期关于全球 AI 领域新产品和新研究的 Newsletter,也翻译并分享了若干篇 AI 领域的重要文章,旨在与大家一起见证 AI 领域的更新迭代,希望能够共同探讨,彼此启发。


本期内容是我们整理发布的第 9 期全球 AI 动向 Newsletter,包括了近期的 3 个新话题,14 个新产品与 10 篇最受关注的论文。如果你有收获和想法,欢迎在评论区与我们交流。


五月末,AI 的竞争依旧激烈:Microsoft 在 Build 2023 发布了 50 多项新产品,一切都与 AI 相关;Google 除了将图像生成功能整合进了商业营销工具与 Bard,还正式开始测试 AI 版搜索引擎;Meta 开源了基于圣经训练的,可以识别超过 4,000 种口语,对 1,100 多种语言进行语音文字互换的 MMS 模型;NVIDIA 突破万亿美元市值,带领其达成此成就的华人 CEO 黄仁勋在 COMPUTEX 大会上沉稳地抛出了一系列产品,其中更有搭载了 256 颗 GH200 Grace Hopper 超级芯片的新型 DGX GH200 超算......巨头们的竞争下文中我们不再赘述,

本期,我们将为大家带来以下内容:

- 3 个新话题 - 媒体该如何更有价值地进行 AI 报道?不同国家在如何制定 AI 相关政策?关于 AI 安全,有哪些重要的观点?

- 14 个新产品 - 包括 4 个有用的和 3 个好玩的新产品,5 个初创公司的新产品以及 2 家大公司的新动态;

- 10 篇新论文 - 上周热度最高的 10 篇新论文,与上次一样,每篇我们都提供了论文原文链接与最具代表性的 Twitter Thread。


Enjoy!

AI · 话题

How the media is covering ChatGPT|拒绝炒作,理性报道


在过去半年多的时间里,媒体对 AI 的报道呈爆发式增长趋势,不少新闻记者都在绞尽脑汁以求在自己的报道中体现出「细微差别」,但有多少人在回归新闻的本真,「引导公众关注并思考真正重要问题」

Jem Bartholomew 和 Dhrumil Mehta 采访了大量的记者与学者并对 2022 年 11 月至 2023 年 5 月中旬关于 AI 的报道进行了统计分析,为我们呈现了一份相对客观完整的报告。


其中的一位受访者 Jenna Burrell 指出,过度讨论 AI 的「技术未解之谜」事实上会分散人们对诸如「AI 对市场结构的影响」之类的问题的注意力——在关注 AI 能力与感知的同时,我们也应关注 AI 如何进一步分配财富和权力。

与此同时,两位作者也为我们总结了一个新技术新闻报道的炒作周期框架

- 首先,新技术会带来各类承诺与期待;

- 然后,媒体报道会分化为两个极端,一边可能是「行业终结者与民主末日」,另一边则是「技术带来乌托邦」;

- 最后,报道开始更细致地讨论技术的实际影响 —— 这是周期开始冷却的时候。

🔗 https://www.cjr.org/tow_center/media-coverage-chatgpt.php


Statement on AI Risk|AI 风险声明


硅谷又开启了新一轮 AI 风险声明信的签署潮,其中首当其冲的便是这封由 Geoffrey Hinton、Bill Gates、Sam Altman(OpenAI CEO)、Demis Hassabis(Google DeepMind CEO)、Dario Amodei(Anthropic CEO)等著名企业家与学者共同签署的这封《AI 风险声明(Statement on AI Risk)》,而事实上,正文只有一句话:

全世界都应优先考虑人工智能带来的人类灭绝风险问题,这与大流行病和核战争等社会性风险问题一样重要。


🔗 https://www.cjr.org/tow_center/media-coverage-chatgpt.php


过去几个月里,学界与业界,AI 与非 AI 领域的许多关键组织与人物都曾就 AI 安全问题发表过自己的看法,在这里,梳理一些有价值的观点与大家分享:


1. Is Avoiding Extinction from AI Really an Urgent Priority?|避免 AI 灭绝人类真的是当务之急吗?by fast.ai

🔗 https://www.fast.ai/posts/2023-05-31-extinction.html


2. AI Is Not an Arms Race|AI 不是一场军备赛 by TIME

🔗 https://time.com/6283609/artificial-intelligence-race-existential-threat


3. If we’re going to label AI an ‘extinction risk’, we need to clarify how it could happen|我们即便要将 AI 标记为「灭绝风险」,也需要弄清它为什么会发生 by The Conversation

🔗 https://theconversation.com/if-were-going-to-label-ai-an-extinction-risk-we-need-to-clarify-how-it-could-happen-206738


4. You Can Have the Blue Pill or the Red Pill, and We’re Out of Blue Pills
 |我们将生活在非人类智能的幻觉中 by Yuval Noah Harari

🔗 https://www.nytimes.com/2023/03/24/opinion/yuval-harari-ai-chatgpt.html


5. Yuval Noah Harari argues that AI has hacked the operating system of human civilisation|我们仍然可以规范新的 AI 工具,但必须迅速行动 by Yuval Noah Harari

🔗 https://www.economist.com/by-invitation/2023/04/28/yuval-noah-harari-argues-that-ai-has-hacked-the-operating-system-of-human-civilisation


6. AI 'godfather' Geoffrey Hinton warns of dangers as he quits Google|AI 教父离职前的警告 by Geoffrey Hinton

🔗 https://www.bbc.com/news/world-us-canada-65452940


7. How Rogue AIs may Arise|流氓 AI 是如何出现的 by Yoshua Bengio 

🔗 https://yoshuabengio.org/2023/05/22/how-rogue-ais-may-arise/


8. Governance of superintelligence|超级智能的治理 by OpenAI 


🔗 https://openai.com/blog/governance-of-superintelligence


Copyright Doesn’t Apply To AI Training|AI 训练数据版权应该受保护吗?


日本政府重申不会对 AI 训练中使用的数据实施版权保护,换句话说,AI 训练可以使用任何数据,无论是出于非营利或商业目的,是否有复制以外的行为,也无论是否从非法网站或其他方式获得的内容。


无独有偶,以色列司法部早在今年 1 月就发表了相似的意见。


但并不是没有相反的声音,目前看,在制定 AI 规范法规方面,欧盟的步伐无疑是最快的,而根据 AI Act 初稿,部署 Gen AI 工具的公司将需要披露用于开发系统(训练模型)的所有受版权保护的数据 —— 如果是这样,OpenAI 将不得不退出欧洲。

日本 

🔗 https://technomancers.ai/japan-goes-all-in-copyright-doesnt-apply-to-ai-training/


以色列

🔗 https://www.project-disco.org/intellectual-property/011823-israel-ministry-of-justice-issues-opinion-supporting-the-use-of-copyrighted-works-for-machine-learning/


欧盟 
🔗 https://www.europarl.europa.eu/news/en/press-room/20230505IPR84904/ai-act-a-step-closer-to-the-first-rules-on-artificial-intelligence



AI · 产品

有用的 | For Money


 • AirChat

「口袋里的晚宴(A dinner party in your pocket)。」这是 Naval 对 AirChat 的定义。

抛开文艺的面纱,AirChat 是 Naval 开发的语音社交产品,像是一个异步版 Clubhouse。无需额外翻译,即可用语音与平台上其他说着不同语言的用户进行交流,加上审美非常在线的产品界面,还有 Naval 本人的不定时巡游留言,还没排上号的我真的很像尽快试一试!


提供邮箱和 Twitter 账号(还需关注账号 @getairchat)即可加入 Waitlist,不过目前仅支持 iOS 设备哦!

🔗 https://www.getairchat.com/


 • Spawning

艺术家作品版权保护工具 —— 主要针对图像,也有部分声音、视频以及代码,具体来说,就是在各类网站之上加一个「同意层」,需要经过创作者的同意才可使用网站数据进行 AI 训练。

截至目前,Spawning 目前已经帮助 14 亿张图像退出模型训练集。


🔗 https://spawning.ai/

 • ChatOCR

一个有意思的 PDF 处理 ChatGPT Plugin 插件,除了读取常见的文字、图表以及图片等信息,它甚至可以抓取手写文字与扫描内容!


🔗 https://www.staf.ai/

 • Poolside

GitHub 前 CTO Jason Warner 将其创办的新公司定位为「未来系统的系统」。根据当前的新闻报道,更像是真正可以投入生产的无代码软件搭建平台。

🔗 https://medium.com/redpoint-ventures/fresh-ink-hello-poolside-384923ff3ad4


🔗 https://www.newcomer.co/p/former-github-cto-jason-warner-raises


好玩的 | For Fun

 • Paragraphica

根据定位自动收集数据并生成关键词补全 prompt 以生成环境「照片」的相机,由手工达人 Bjørn Karmann 制作。

下面的几幅示例图中,Bjørn 看似拿了一台「相机」,但事实上,这台相机只是一个定位设备,没有任何拍摄功能,三个物理旋钮则是为了调节参数而存在,分别用于控制数据收集的地理半径、图像噪声与遵循 prompt 的程度。


相机所收集的数据与工作原理如下:


基于以上工作原理,想必大家应该发现了:这是在手机上就可以实现的功能呀!没错,打开第二个链接即可体验。

🔗 https://bjoernkarmann.dk/project/paragraphica

🔗 https://paragraphica.bjoernkarmann.dk/

 • KURUKURU

由两位华人女孩创办的漫画生成平台,目前已被 YC 投资。

CEO @FengjiaoPeng 毕业于香港大学与 MIT,此前是一位一边在 Adobe 与 Vimeo 担任工程师,一边进行网络漫画创作的斜杠青年,出于对漫画的热爱,与同样是理工科出身的 @YipingLyu 创办了 KURUKURU,侧重连续故事情节的生成以及工作流的易用性 —— 期待更多的进展!


🔗 https://www.kurukuru.xyz/

 • GirlfriendGPT

虽然训练一个 Character 的技术难度愈来愈低,但依旧不够小白——试试用 GPT-4 构建一个性格可爱的女朋友吧!


🔗 https://gptgirlfriend.online/


初创企业|Startups

 • lnkyMM by OctoML

第一个开源的可商用多模态模型,基于 MPT-7 Instruct 与 BLIP 搭建。


🔗 https://mm-frontend-ees4nzlyjlh8.octoai.cloud


 • Spellbook

用 LLM 帮忙起草合同,目前已有超 600 家企业客户。但请注意,AI 帮忙起草法律文件也许可以节省不少时间,但千万不要因为有了工具而偷懒。最近,同样是在法律行业,一位美国律师用 AI 协助处理案件时显然遇到了大问题 —— 他在庭审时提供了 6 个由 ChatGPT 生成的虚假案件。


🔗 https://www.spellbook.legal/

 • Assistant by Betterlegal

在几秒钟内将复杂的法律术语转换为通俗易懂的语言,相对于生成合同、辩词、判例等,也许这是对大众更实用,风险也更小的场景~


🔗 https://betterlegal.com/assistant

 • Botatouille by Buzzfeed

据称是全球第一款 AI 烹饪小助手,基于 ChatGPT API 搭建,支持 10,000+ 菜谱的问答与制作指导,内置于 Buzzfeed 的 Tastey app,目前仅支持 iOS 端。


🔗 https://apps.apple.com/us/app/tasty-recipes-cooking-videos/id1217456898

 • CapeChat by Cape Privacy

在使用 ChatGPT 的同时保持敏感数据的安全。我们已经见到了许多用 ChatGPT 这样的 AI Chatbot 处理财务数据、日程以及其他个人信息的案例,但这么做是否能够保证数据安全?说实话,我个人一直保持怀疑态度,而 CapeChat 就是一个把数据安全放在第一位的 Chatbot,这真的是一个很棒的切入点!


🔗 https://chat.capeprivacy.com/chat/1685655970623



头部公司| Leading Companies

 • Photoshop Beta by Adobe

Adobe 终于改变了 33 年的稳健作风,大手笔地将 Firefly 整合进了 Photoshop,说实话,这是我最近见到的最有趣的 AI 产品之一,AI 图像生成功能终于被丝滑地融入了工作流。


先说优点,无论是抠图、补全画面、局部擦除还是扩展画面内容,Beta 都能为创作者节约大量的制作时间和精力,在已有图片的基础上快速修改至 60 分;

再说缺点,与之前的感受相同,Firefly 生成图像的真实性并不高,在某些图片中非常容易出现违和感;此外,Beta 也不擅长从零制作图片,且无法精确控制组件/角色的位置、面部细节和动作等等重要信息。—— 期待 Adobe 的进步了!

🔗 https://www.adobe.com/products/photoshop/generative-fill.html

一些有趣的例子 

🔗 https://twitter.com/nathanlands/status/1663878082007281668?s=46&t=O5v_r8PPMabZ2rXHdeCbcA


 • Tako by TikTok

5 月 25 日,TikTok 宣布他们正在菲律宾部分测试用于更精准寻找短视频的聊天机器人 Tako,目前技术由第三方提供。


🔗 https://twitter.com/TikTokComms/status/1661718779024531456



AI · 技术

QLoRA


一种高效的微调方法,通过减少内存使用量,在单个 48GB GPU 上微调 65B 参数模型,同时保持完整的 16 位微调性能。


Paper 

🔗 https://arxiv.org/abs/2305.14314

Twitter 
🔗 https://twitter.com/Tim_Dettmers/status/1661379354507476994


LIMA


一个新的 65B 参数的 LLaMa 模型,通过 1000 个精心设计的提示和回应进行微调;它不使用 RLHF,对于训练数据中没有的任务具有良好的泛化能力,并且在 43% 的情况下生成的回应与 GPT-4 相当或更受欢迎,甚至比 Bard 更高。


Paper 

🔗 https://arxiv.org/abs/2305.11206

Twitter 
🔗 https://twitter.com/violet_zct/status/1660789120069926912

Voyager


在 Minecraft 中使用 LLM 技术的具有体验型终身学习功能的代理人,可以不需要人类干预就能持续探索世界、获得技能并进行新的发现。


Paper 

🔗 https://arxiv.org/abs/2305.16291

Twitter 
🔗 https://twitter.com/DrJimFan/status/1662115266933972993


Gorilla


一种基于 LLaMA 的微调模型,超越了 GPT-4 在编写 API 调用方面的性能。这种能力可以帮助识别正确的 API,提高 LLM 与外部工具进行交互完成特定任务的能力。


Paper 

🔗 https://arxiv.org/abs/2305.15334

Twitter 
🔗 https://twitter.com/omarsar0/status/1661540207206846464



The False Promise of Imitatiting Proprietary LLMs


本文对以更强模型的输出进行微调的模型进行了批判性分析;认为模型的模仿是一个错误的前提,改进开源模型的更有效方法是开发更好的基础模型。


Paper 

🔗 https://arxiv.org/abs/2305.15717

Twitter 
🔗 https://twitter.com/arankomatsuzaki/status/1661908342829187072


Sophia


本文提出了一种简单可扩展的二阶优化器,每步平均时间和内存开销几乎可以忽略不计;在语言建模方面,Sophia 在步数、计算量和实际时间上比 Adam 快 2 倍。


Paper 

🔗 https://arxiv.org/abs/2305.14342

Twitter 
🔗 https://twitter.com/tengyuma/status/1661412995430219786



The Larger They Are, the Harder They Fail


文章表明,当默认函数名称被交换时,LLM 便无法生成正确的 Python 代码,而且模型越大,越倾向于生成错误的结果 —— 这与此前我们观察到的「模型越大,能力越强」的规律相反。


Paper 

🔗 https://arxiv.org/abs/2305.15507

Twitter 
🔗 https://twitter.com/AVMiceliBarone/status/1662150656327663617



Model Evaluation for Extreme Risks


讨论了模型评估在解决极端风险和在模型训练、部署和安全方面做出负责任决策中的重要性。

文中还详细讨论了十个主要风险:网络攻击、欺骗、说服与操纵、政治策略、武器获取、长期规划、AI 开发、情景意识以及自我传播。


Paper 

🔗 https://arxiv.org/abs/2305.15324

Twitter 

🔗 https://twitter.com/soundboy/status/1661728733156503555



LLM Research Directions


讨论了一系列针对希望在 LLM 领域进行研究的博士研究生的研究方向。


Paper 

🔗 https://arxiv.org/abs/2305.12544

Twitter 
🔗 https://twitter.com/omarsar0/status/1661405738059571201


Reinventing RNNs for the Transformer Era


提出了一种将 Transformer 的高效可并行训练与 RNN 的高效推理相结合的方法;结果显示该方法在性能上与大小相似的 Transformer 相当。


Paper 

🔗 https://arxiv.org/abs/2305.13048

Twitter 

🔗 https://twitter.com/_akhaliq/status/1660816265454419969



禅修时刻 · Short Courses by 吴恩达

要说这两天什么课最火,那必然是吴老师的四节生成式 AI 短课程,从 Prompt Engineering、API 调用、LangChain 的使用到 Diffusion 模型的原理,一应俱全!


🔗 https://www.deeplearning.ai/short-courses/




更多被投新闻
依图科技 | Momenta | Nuro | 云天励飞
禾赛科技 | 晶泰科技 | 地平线 | 燧原科技
亿航智能 | 思谋科技 | 青藤云安全 | 爱笔智能
沐曦 | 驭势科技 | 芯耀辉 | 森亿智能 | AutoX
格灵深瞳 | 曦智科技 | 来也科技 | 星亢原
黑湖智造 | 领创集团 | 非夕机器人
芯行纪 | 灵明光子 | 优艾智合  | 炬星科技
东方空间 | 循环智能 | 诗云科技 | 赛舵智能
潞晨科技 | 芯控智能 | 氦星光联 | 悠跑科技


推荐阅读



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
[围观]全部资料来了!全网最受关注的女孩!深度好文|一个咨询人的3年,5年,10年【附PDF】整理了114篇医疗论文,含cvpr2023医疗论文+经典论文+医疗论文综述等报税季节忆报税谁是国内最受关注的AIGC算力玩家?玩家榜单&全景报告案例征集中今年下半年,值得重点关注的30+新开购物中心【23年5月】心内科上月最受关注的SCI论文;这个医院发布的论文累计影响因子最高16股获机构扎堆评级,城商行龙头最受关注!27股获上调评级哇塞|全部资料来了!全网最受关注的女孩!本周美国FDA将对四个极受关注的新药申请做出裁决;包括杜兴肌营养不良的首个基因治疗,这次还会出现惊天逆转吗?ACL 2023奖项公布:3篇最佳论文、39篇杰出论文,多家国内机构上榜上海车展最受关注20款智能车【23年5月】血液科上月最受关注SCI论文推送丨这个期刊发文最多!【23年6月】神经科上月最受关注SCI论文简介;这两个2区杂志,发文量大、审稿速度快!AI竞赛再度升级!一文速览4月初10个最具代表性的AI代理与31个新产品2023年最受种子轮投资者关注的四大行业博客图片回国心切 - 看望老妈【23年5月】神经科上月最受关注SCI论文简介;这个医院发表的论文累计影响因子最高!苹果新产品将取代iPhone?啥专业能抓住这个新风口?代号"白发",普京提议的瓦格纳新话事人啥来头?险资今年密集调研超2500次,看了700只股!哪些最受关注?全部资料来了!全网最受关注的女孩!【泌尿外科】23年5月,这10篇论文最值得一读(附原文);有3个期刊审稿特快【23年5月】风湿科上月最受关注SCI论文解析丨基础和临床的交叉,推动风湿免疫科的进步某双一流高校一周近20篇论文被质疑图片造假,结果通讯作者竟回:电脑中病毒了!备受关注的朝鲜停战模式3个小时赶出来的论文一稿过!我发现了这个比ChatGPT还好用10倍的论文神器【23年5月】心外科上月最受关注的SCI论文;这个医院发表的论文累计影响因子最高关注全球先锋话题,《时尚芭莎》举办生物多样性保护与性别倡议活动「大一统」大模型论文爆火,4种模态任意输入输出,华人本科生5篇顶会一作,网友:近期最不可思议的论文窗外的玉兰花备受关注的Clean Fit,真的是一种新风格吗?转发邮件 80-20 关于亚裔美国人聚焦产品与商业融合,北京数字化产品经理大会14位业务专家,探寻产品新商业增长方向
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。