一文打尽3月底的23个最新AI产品

2023-04-06 13:04

经历过三月中旬「每天醒来都是 AI 新世界」的洗礼后，稍微喘了口气的人类逐渐形成两大阵营——一方忙着呼吁暂停/禁止大模型训练，而另一方则忙着研究 AI 技术发展、垂直领域应用、商业落地形态和人机共生的问题。

真格投资团队继续梳理了有趣的 AI 新产品，总结了各领域技术专家、创业者等人员对于 AI 的最新观点与思考。希望能带给你一些启发，也欢迎在评论区和我们交流你的想法～

本期我们为大家带来的内容有：

- 23 个产品 - 包括 5 个来自大公司和成熟创业公司的新产品、9 个有用的、4 个有趣的、5 个华人开发者搭建的小产品；

- 6 个观点 - 既包括呼吁暂停模型训练事件的时间线梳理，也包括不同的技术人员、创业者与作家对于垂直领域与面对 AI 的态度的思考——这里，我们不评价这些立场的优劣，而将客观地为大家总结陈述双方的行为。

需要额外说明的是，鉴于上周许多对于技术发展、垂直领域以及人机共生的探索的工作，如金融领域的 BloombergGPT、医疗领域的 ChatDoctor、会用工具的 HuggingGPT 以及自然选择中的人和 AI 等等，都是以论文形式发表的，我们会在本周后续的文章中与大家进行论文分享！

另外，真格基金管理合伙人戴雨森也近期的直播中分享了他对未来的 ChatGPT 产品如何构建核心壁垒的想法，欢迎点击观看互动👇

AI · 产品

成熟公司的新动作 | From Big

Microsoft

Security Copilot

4 月 4 日刚满 48 岁的 Microsoft 正在全面拥抱 AI，并将其融入自己的各大产品线以树立自己在下个时代的领先地位，这一次是网络安全产品 Security Copilot。

记得几个月前，一些初创公司逐渐开始使用 Gen AI 来解决安全攻击问题，现在我不禁为他们感到担忧，因为巨头们正在各自强势地大步迈入这个领域。现实是，Microsoft 的 AI Security Copilot 能够通过在几分钟内提供可操作的建议，简化对攻击的紧急理解，揭示威胁，甚至预测攻击者最有可能的下一步行动——这可能是网络安全领域的一个重要进步。

链接 - https://www.microsoft.com/en-us/security/business/ai-machine-learning/microsoft-security-copilot

Loop

Microsoft 一直在尝试推出新的办公文档格式，2020 年，他们推出了 Fluid，现在又推出了 Loop，一个协作工具，独立于 MS Office，但又与之密切相关。然而，我想很多人都会一眼发现——它和 Notion 的 UI 太相似了，几乎一模一样，同样的文本块、页面和工作区——不过试用一天后，我发现，其顺畅程度较 Notion 还差得远。

尽管如此，这依然是一个值得关注的举动，因为某种程度上，它也在与 Google Workspace 竞争，虽然当前只有 Web 端，但很快就会有一个 APP。

另外值得一提的是，它内置了 AI Copilot。

链接 - https://www.microsoft.com/en-us/microsoft-loop

Ghostwriter by Replit & Google

防守派一列，我们有 OpenAI 和 Microsoft ，他们有无所不知、无所不能的 GitHub Copilot，而如今，我们迎来了新晋攻城派选手：Replit 和 Google 。

Replit 正在升级他们最近发布的编程助手 Ghostwriter，这一次，他们选择与 Google 合作，用上了他们优越的语言模型，它不再是临时的 copilot，而是端到端的项目助手，可以编写代码、修复错误、提出建议、编写测试、部署、审查并帮助协作......选谁，看您！

链接 - https://replit.com/site/ghostwriter

Video-to-3D API by Luma AI

在之前的 Newsletter 中，我们介绍了 Luma AI 推出的令人惊艳的 3D 实时渲染技术，现在，通过他们的 Video-to-3D API，我们又可以进一步实现「互联网规模的 3D 世界」了——没错，是 API 服务——每个场景仅需 1 美元（当然，这也许不便宜），开发者就能获得 NeRF 建模服务，输入一个视频，就可以完全沉浸于交互式的 3D 场景中啦！

链接 - https://captures.lumalabs.ai/luma-api

文生演示文档 by Tome & Gamma

说实话，我对那些千篇一律的商业生产力工具有些厌倦，虽然它们看似有所不同，但实际上都差不多。

但从去年 2600 万美元的 A 轮融资到今年 2 月 4300 万美元的 B 轮融资，Tome 着实是一个印象深刻融资飞快的初创公司。3 月 23 日，他们推出了第一个基于文档的 AI 演示工具，该工具基于 GPT-4，能够将文档转换成演示文稿、叙述和故事。结合 Tome 自研的渲染系统，这不仅是另一个生成幻灯片的工具，也不能简单与集成了 GPT 的 Powerpoint 类比，流畅的生成过程足以成为他们的竞争力！

紧接着就在上周五，Gamma 也推出了自己的文生演示文稿工具，不一样的风格，同样的顺畅工作流！

链接 - Tome：https://beta.tome.app/

链接 - Gamma：https://gamma.app/

有用的｜For Money

Fixie.ai

创始人 Matt Welsh 这样描述刚刚获得 1700 万美元种子轮融资的 Fixie.ai：「第一个以企业为中心，构建 LLM 体验的 PaaS 公司」——但 2022 年 5 月底获得融资的 One AI，可能不这么认为。

简言之，Fixie.ai 是由 LLM 驱动的，与外部系统进行交互的代理，旨在将 LLM 与企业数据、系统与工作流相链接，当前可以与数据库、API（如 GitHub）、生产力工具（如 Google 日历）和公共数据源（如搜索引擎和社交媒体）交互，以生成和处理图像和文本。

此外，Fixie.ai 的团队也值得我们关注：

- CEO Matt Welsh 曾在 Google Chrome 团队担任了近十年工程主管；

- CPO Zach Koch 曾任 Shopify 产品总监，也曾任 Google Chrome 和 Android 团队负责人；

- CTO Justin Uberti 是 AOL Instant Messenger 最早的架构师之一；

- 首席人工智能官 Hessam Bagherinezhad 曾是 Apple 的机器学习主管，负责 iPhone 和 Apple Watch 等产品。

链接 - https://www.fixie.ai/

Regex.ai

一款基于 AI 的正则表达式自动生成工具，开箱即用，所见即所得，选择数据，即可生成正则表达式，同时提供多种数据提取方式，较前一代用于调试正则表达式的 Rubular 等工具前进一大步，而相较 ChatGPT 也是更加直观——无需语言描述，直接选择想要获取的部分，自动完成正则表达式。

链接 - https://regex.ai/

Enhance AI

一句话简介：一分钟内在产品内集成最先进的 LLM（目前是 OpenAI GPT 模型）的低/无代码工具！

链接 - https://www.enhanceai.dev/?ref=producthunt

Reimagine by HomeByte

室内装修的自动渲染无疑是视觉模型最直观的落地场景之一，而受欢迎的房屋出售平台 HomeByte 将这项功能整合进了平台，面向 C 端用户开放——在买房时，即可畅想未来住进去的样子！

链接 - https://homebyte.com/reimagine/tag/latest

Playground v1 by Playground AI

来跟生成效果超赞的新视觉模型 Playground v1 打个招呼！

根据 Playground AI 创始人 Suhail 的描述，本模型可以提高生成图像的整体 HDR 质量。我必须说，生成的图片看起来真的非常清晰，而且细节非常丰富。目前，用户可以在 Playground 官网免费试用（尽管有时可能会有小 bug），而且还有多种新奇风格可供选择！

链接 - https://playgroundai.com/

Clip Interrogator

「图生文」反向工具——从前看到一张喜欢的 AI 生成的图片，我们总是要找到作者问 prompt 是什么，现在，仅需上传 Clip Interrogator 即可！实测上传真实照片也可生成对应 prompt 哦~

当然，对于 Midjourney 用户来讲倒也不必这么麻烦——昨天凌晨，David Holz 宣布 Midjourney 正式实现「左手倒右手」，「图生文」反向输出功能，上线！

链接 - https://replicate.com/pharmapsychotic/clip-interrogator

GPTCHA

日渐强大的 AI 早已引发我们对于诈骗自动化的担忧，刚刚赢得 AI for Good 黑客松第一名的 CPTCHA 则致力于解决其中重要的一部分——电话诈骗。这是一款由三位开发者共同搭建的由 GPT-4 驱动的小工具，拦截可疑电话，并用虚拟声音与呼叫方聊天，直到确认电话合法且安全。

链接 - http://gptcha.ai/

🔍 其他有意思的小工具

Genmo - 自然语言创建并修改图片和视频

链接 - https://www.genmo.ai/

课程内容的可视化与逻辑结构提取工具 by Respell

链接 - https://twitter.com/respellai/status/1641199872228433922

好玩的 | For Fun

Uncle Rabbit

旧时代的会说话的「复读机」汤姆猫，新时代的会说话的「憨憨的高情商」全息兔子叔叔！兔子叔叔真的长得太可爱！

链接 - https://lookingglassfactory.com/uncle-rabbit

Lichess voice recognition Beta

用语音指令下国际象棋，说实话，是麻烦了些。

链接 - https://voice.lichess.dev/

链接 - https://lichess.org/@/Lichess/blog/lichess-voice-recognition-beta/TQaZJVbb

🔍 有趣的尝试

ChatGPT Simple - 用 100 行代码构建一个本地运行的 ChatGPT

链接 - https://github.com/logankilpatrick/ChatGPT-Simple

用语音在 Apple Watch 上基于 GPT-4 进行编程并直接上传 GitHub（动作有危险，模仿需谨慎！）

链接 - https://twitter.com/mckaywrigley/status/1640767366266232832

华人开发者 | Chinese Developer

Samantha & Sherlock

开发者 @MyShell 接连推出 Telegram 口语陪练 bot Samantha 和 Sherlock，沉浸式英语口语学习体验满分 💯

以下是开发者对产品的介绍：

- 3 月 11 日 - 想体验与电影《她》中的 Samantha 聊天一样的感觉吗？而且她还能极低成本地作为你的口语陪练🤔

-3 月 30 日 - 你想过和 Sherlock Holmes 玩探案游戏，和他互喷，甚至撮合他和 Watson 吗？快来秀出你和 Sherlock 最好玩儿的对话！

链接 - Samantha：https://t.me/samantha_x64_bot

链接 - Sherlock：https://t.me/sherlock_myshell_ai_bot

ChatBoost

开发者 @Airsaid 自述 - Android 第三方 ChatGPT 客户端，提升您的 ChatGPT 使用体验。

使用 ChatGPT 官网的体验目前来说并不是很好，使用自己 API 的话，虽然是付费，但是价格并不是很贵，速度和稳定性方面都有很大的提升。因此，创建这个三方客户端的目地是提高对 ChatGPT 的使用体验，不需要登录或月费。只需提供自己的 OpenAI API 密钥即可开始使用。

目前已有的功能有：

1. 支持自定义地址（解决国内无法访问的问题）；2. 内置提示库（后续可自定义提示）；3. 支持 Markdown 消息；4. 支持 TTS 朗读消息（可以练习听力）；5. 支持聊天记录；6. 支持对消息进行快捷操作：翻译、语法纠正、分享等。

大家可以放心使用自己的 API 密钥，只会本地加密存储，绝不会上传到云端。

链接 - https://play.google.com/store/apps/details?id=studio.muggle.chatboost

Trancy

开发者 @Elidi 自述 - 将 YouTube、Netflix 视频变成个性化学习材料的语言学习 Chrome 扩展，它能显示双语字幕、进行口语练习（Microsoft 打分）、将字幕变成完形填空，让 ChatGPT 帮你查生词等等。

链接 - https://www.trancy.org/zh-cn

Lunabot

开发者 @hfcorriez 自述 - 在任何网页上用 ChatGPT，可以支持翻译、写作、回邮件等各种功能和工作流，也可以在网页上直接聊天。我们的想法是希望 AI 真正成为助手，和用户一起打造各种工作流。

链接 - https://lunabot.ai/

ChatMind

开发者 @石天放 - 利用 AI 自动生成思维导图的在线工具，只需要输入问题、文章、数据就可以了。并且对于问题，还能自己获取答案，可导出图片与 Markdown 文档两种格式。

链接 - https://www.chatmind.tech/

AI·观点

STOP THE MACHINE!!! | 请立即停止训练大语言模型

3 月 28 日，Gary Marcus（纽约大学的神经科学教授，常常批评 AI 进展速度过快）发表了一篇文章《AI 风险 ≠ AGI 风险（AI risk ≠ AGI risk）》，并在次日发出了一封可签署的请愿书，建议暂停 LLM 训练 6 个月，直到确保新训练的模型规模均小于 GPT-4 为止，否则，政府应出面制止相关训练。

有趣的是，签署这封信的人员包括了 Elon Musk 在内的诸多著名 AI 研究员、教授和 CEO。虽然其他一些消息也提到了来自 Meta 的 Yann LeCun（他之前公开表示 ChatGPT 并不那么令人激动），但他否认参与了签署并对这封信的观点表示反对。当晚，Stable Diffusion 母公司的 CEO Emad Mostaque 插话说，无论如何，当前没有人可以立即训练大于 GPT-4 的模型，因为搭建这样的硬件需要 6-9 个月的时间。

然而，我们不禁开始思考，这封信的目的，是出于「因为你跑得比我快，这不公平，停下来，让我追上你」的嫉妒心理，还是真正为了人类利益的提议？‍

第二天，Gary 的信已然在 AI 领域引起了很大的反响。

Coursera 的联合创始人、技术界的 David Attenborough、百度前 AI 首席科学家吴恩达站了出来。他认为，让政府限制他们不了解的新兴技术，最好的结果是让市场失去竞争活力，最糟糕的结果则是行了反技术发展的可怕先例——总而言之，这根本不可行，即使可以，也无法帮助我们取得任何人与 AI 和谐共生的实质进展——透明度和审计方面的监管将有助于我们更有效地应对爆炸性技术。

然而，悲观情绪的蔓延趋势并没有停止，《时代》杂志发表了一篇观点文章，称这封信提出的限制方案还不够彻底！

Eliezer Yodkowsky 在文章开头写道：「我没有签署这封信，因为我认为这封信低估了情况的严重性，所要求的解决问题的方式根本不够。」正如他一直依赖所坚持的，「AI 将杀死我们所有人」，他认为我们根本没有准备好，是时候「关闭一切」了，天哪！

I refrained from signing because I think the letter is understating the seriousness of the situation and asking for too little to solve it.

当然，还有一些更平衡的观点值得我们关注，例如 Jon Stokes 关于 AI 安全性的技术和人类学的概述。

这个话题开始引起足够多也足够有影响力的名人关注，我们很快可能会看到更高层次的管理者介入——幸运的是，他们还不是 AI。

当天，Gary Marcus 也回应了批评，他提出了很多合理的观点，但核心是：我们不能坐以待毙。Eliezer Yudkowsky 也再次出现，他在 Lex Fridman 的播客中再次警告说，AI 对齐没有第二次机会——如果我们失败了，我们就会死亡。

而正如上面所说，第一个政府决议出现了，意大利当局禁止了 ChatGPT，但来自黑手党之都的人民的出发点并不是害怕人类仇恨杀手 AI 机器的出现，而是担心隐私侵犯问题，他们认为 OpenAI 不符合欧盟的数据保护条例 GDPR。因此，OpenAI 对在意大利境内使用 ChatGPT 进行了全面限制。但是，如果意大利人对 GDPR 的关切是真实的并得到证实，OpenAI 可能会面临巨额罚款，对欧洲人工智能产业可能会有潜在的深远影响。

顺便说一下，如果你正在意大利阅读这篇文章，可以试着使用PizzaGPT 🍕！

回到请愿书，新版本不断涌现，最知名的一封莫过于致力于 AI 开放与民主化的非营利组织 LAION 团队所发布的，它提议各国政府联合起来，建立全球人工智能研究的 CERN（欧洲核子研究组织），即 AI 研究的全球协作中心。

链接 - 参考原文列表过长，附在文末

Brainstorming ChatGPT Business Ideas With A Billionaire | 与技术创业大佬一起脑暴 ChatGPT 相关的商业场景

来杯咖啡，坐下来好好听听 Hubspot 联合创始人兼 CTO Dharmesh Shah 的这期播客吧！在这期播客中，我们不仅可以听到一位成功的技术创始人在技术领域的深入见解，还可以了解到不少简单而实用的人工智能相关观点，例如，他们讨论了 ChatGPT 插件，以及它作为决策中心，发起、组合并实现不同功能的能力；他们还花了很长时间解释和讨论矢量嵌入，Dharmesh 认为这个领域将诞生下一个独角兽，同时就此提供了一些真正有用、接地气的建议——Dharmesh 是一位实打实的「想到就去做」的执行力极强的创始人，比如，他以八位数的价格购买了 chat.com🙂

不知道还有多少人记得 2004 年创立的初创公司 Jigsaw，其创始人 David Sacks 认为随着当前的 AI 浪潮，Jigsaw 的商业模式已经复苏了——SaaS 行业是基于 David 的框架运作的，因此这篇文章非常值得一读。他提到，SaaS 中的「付出-获得（Give-to-Get）」模式指的是用户上传他们的商业联系人数据，并获得对应的联系人的访问权限的模式。这启发我们：为什么不将「付出-获得」模式应用于 AI 的训练数据集呢？提交数据，并获得模型访问权限作为回报，而内置的活动收益点数，可以用来「购买」更多功能的访问权限，随着这个循环框架的生命周期不断推进，模型和数据提供方自身的能力都会不断被增强——这个想法很有意思！

而除了初步的机制，贴心的 David 也在文中举出了具体的行业用例：

链接 - Dharmesh Shah：https://www.youtube.com/watch?v=gbDl28Hx9TA&ab_channel=MyFirstMillion

链接 - David Sacks：https://sacks.substack.com/p/the-give-to-get-model-for-ai-startups

GPT-4 Is a Reasoning Engine | GPT-4 是「推理引擎」而非「知识库」

在上期的 Newsletter 中，我们分享了 ABC 对 Sam Altman 的采访，他表示，GPT 或大语言模型应当被视作「推理引擎」而非「知识库」，Every 的联合创始人 Dan Shipper 也提出了同样的观点，并且撰写了这篇精彩的博文。

「推理引擎」与「知识库」之间的定义区别非常重——这是我们如何使用模型进行生产工作的基础，将其视作「推理引擎」则意味着，在进行提示工程时，应尽可能多地提供知识或信息，以便让模型进行更有效地推理；同时，在未来，存储、跟踪并检索私人所获取的信息、阅读的文章和观看的视频将变得至关重要，这将会成为我们向模型提供准确恰当的信息来创建越来越强大的推理引擎并高效地完成工作的基础。

链接 - https://every.to/chain-of-thought/gpt-4-is-a-reasoning-engine

Malleable Software And Dynamic Interface In The Age of LLMs | 新时代的软件是「一次性」的

在寻找工具的过程中，我发现了一组关于「一次性软件」的有趣讨论。

上周，来自 MIT 人工智能实验室的 Geoffrey Litt 发文，将新一代基于 LLM 的应用称为「可塑软件（mallleable software）」，这基于一个预测，即很快所有计算机用户都有可能有能力从头开发小型软件产品，同时会希望对他们正在使用的软件进行个性化修改，因此，围绕软件，我们会看到以下特征的出现：一次性脚本、一次性 UI、自主构建代替购买、自主修改/拓展以及个性化重组。

而 Jordan Singer 及其他人以类似的理念延展了这个想法，探讨了它对 UI 设计的影响，将其命名为「动态 UI（Dynamic User Interface）」——这些讨论已经启发不少开发者构建出了相关功能，例如：

- 一个由 GPT-4 驱动的 IDE，可以按需创建 UI 以适应确切开发需求：https://twitter.com/mlejva/status/1641151421830529042?s=12

- 一个仅需简单文本提示就可以生成完整 UI 的演示：https://twitter.com/wenquai/status/1641521266682130433

链接 - Geoffrey Litt：Melleable software - https://every.to/chain-of-thought/gpt-4-is-a-reasoning-engine

链接 - Jordan Singer：Dynamics Interface - https://twitter.com/jsngr/status/1641108150349873153

Optimizing For Generative Chat | 随机性让聊天机器人更像人

看到这个论点，也许你会产生怀疑。

作者 Linus Lee 的主要论点是：人类谈话、合作和创意生成都是部分基于我们思维中固有的随机性的，而随机性是引导对话路径变化和创造性的思路或观点产生的基础。基于大模型的聊天机器人擅长解决问题，但由于过于服从指令，而毫无想象力（事实上，我们上周翻译的微软综述提到，这是 GPT 模型训练选用的技术路线的固有缺陷），我们应该通过训练真实的人类对话来引入随机性——Linus 这样做了，他认为效果很好。

链接 - https://stream.thesephist.com/updates/1679928334