上周又有很多很有意思的 AI 工具涌现了出来,例如 GPT-4 上尚未发布的识图功能被一个开源项目组抢先做出,一个新的语音转文字工具可以帮你又快又好地完成转录工作。5 条新鲜资讯
4 个有用工具
4 个鲜明观点
1 个有趣创业案例世界正在剧变,Hunt Good 周报是这场变化的见证者。🫶 Google 合并 Deep Mind 和 Google Brain 团队本周四 Google 正式宣布将旗下 DeepMind 和 Google Research 的 Brain 团队合并为一个名叫 Google DeepMind 的部门,专注于人工智能研究、产品和解决方案的开发。Google 表示,创造 Google DeepMind 将汇聚世界级的人工智能人才、计算能力和资源,创造下一代的科研突破和产品。该部门将由 DeepMind 的联席创始人兼首席执行官 Demis Hassabis 领导,成员来自全公司各部门。做出过 Alpha GO 的 DeepMind 和 Google Brain 都是世界上顶尖 AI 研究所,Google 将这两股力量联合起来,目的也十分清晰——应对 OpenAI+微软联盟的竞争。🔗 DeepMind 公告:
https://www.deepmind.com/blog/announcing-google-deepmind
🔗 Google 公告:
https://blog.google/technology/ai/april-ai-update/福布斯与红杉资本和 Meritech Capital 合作发布了 2023 年的年度 AI 榜单,列出了最具有潜力的未上市 AI 公司。今年是福布斯发布该榜单的第五年,有点特殊的是,2023 年的榜单是福布斯首次将 AI 50 拓展到北美以外的全球榜单。这 50 家公司总共获得了 272 亿美元的融资,其中许多上榜公司已经致力于 AI 多年。榜单中规模最大的公司 Databricks 雇用了 5000 多名员工。Adept、Anthropic 和 Cohere 等公司是成立不到两年,已经获得数亿美元投资的公司。如果你想了解和关注 AI 领域最有价值和潜力的公司,这份榜单会给你答案。🔗 https://www.forbes.com/lists/ai50/?sh=1a2d4092290fMeta 绝对是近期你最不应该错过的 AI 大公司之一。近日,Meta 推出了新的开源人工智能模型 DINOv2,给计算机视觉领域带来了一点小小的震撼。DINOv2 模型旨在准确识别图像、视频和其他视觉输入中的单个对象。它利用自我监督学习机制,允许它从任何图像集合中学习,不管它们是否经过手工标记的。举个例子,DINOv2 会通过学习一只狗狗的结构,分别出哪里是头、脚,然后精准地将对象从图像中分割出来。这就催生出许多的应用场景,例如语意分割、图像检索、和分析图像的深度。给该模型一张图,它就可以分辨出一个空间的深度,或者根据图像检索相关的内容,机器对图像的理解比以往有了很大的提升。试想一下,把这些技术与 AR、VR 等场景结合起来,扎克伯克描绘的元宇宙是不是没那么虚无缥缈了呢。Meta 把 DINOv2 模型做成了一个可以体验的 DEMO,感兴趣的朋友可以前往以下地址体验。🔗 https://dinov2.metademolab.com/demos继前两周更新了算数能力后,Google 的聊天机器人在最近又更新了编程能力,可以帮助开发人员编写和调试代码,生成代码,并解释代码行。Google 在介绍中提到,Bard 可以用20多种编程语言为 GoogleSheets 编写函数。看来为了赶上 ChatGPT,Google 的程序员们也是下足了功夫来改善 Bard。不知道他们有没有用 Bard 来给自己编程呢?🔗 https://bard.google.com/updates最近 OpenAI 正面临欧洲数据保护法规的巨大压力,如果无法遵守这些法规,它可能会面临巨额罚款、被迫删除数据,甚至被禁止使用。原因在于 OpenAI 收集训练AI模型数据的方式,即从互联网上大量抓取内容。欧洲多国数据保护机构正在调查 OpenAI 如何收集和处理 ChatGPT 的数据,认为它在未经用户同意的情况下抓取了个人数据。意大利已经暂时禁止使用 ChatGPT,并给予 OpenAI 至 4月 30 日的期限来遵守法规。如果 OpenAI 无法证明其数据使用合法,它可能会在特定国家甚至整个欧洲联盟被禁止。此案例可能导致全球范围内对 AI 公司收集数据的方式发生根本性改变。🔗 https://www.technologyreview.com/2023/04/19/1071789/openais-hunger-for-data-is-coming-back-to-bite-it/GPT-4 相比 GPT-3 更快、更有效、更强大,它唯一的缺点就是要钱。现在有了 Forefront Chat,大家终于可以免费体验 GPT-4 啦。AI 初创企业 Forefront AI 推出的 Forefront Chat 是一个包含图像生成、自定义人物角色聊天等功能的 AI 工具,用户可以在输入框自由选择 GPT-4和 GPT-3.5 模型,并且不需要订阅,只要注册即可使用。在 Forefront Chat 上你可以和乔布斯、米老鼠等 AI 扮演的角色对话,也可以利用它生成 AI 图像。Forefront Chat 的聊天界面和文字输入体验没有 ChatGPT 那么流畅,但在免费面前,这些缺点都可以被原谅。🔗 https://chat.forefront.ai/开源项目 MiniGPT-4 虽然听起来就像是 GPT-4 的「山寨版」或者「青春版」,但其实不容小觑,它实现了现阶段 GPT-4 尚未开放体验的识图功能——对的,就是发布会上面的能看懂梗图的图片理解功能。MiniGPT-4 使用了一种名为 Vicuna 的先进语言解码器作为语言解码器,具有类似于 GPT-4 的能力,并在复杂的视觉语言任务中显示出了出色的结果。训练方面,它需要大约 10 小时的训练和 4 个GPU 和 500 万对齐的图像文本的训练。经测试,MiniGPT-4 不仅能读懂图片的信息,还可以根据这些信息做进一步的分析,例如它根据植物叶子的异常分析出它可能被真菌感染,并给你一些养护建议。🔗 https://github.com/karpathy/minGPT👨🎓 Perplexity
—— 用 GPT-4 解答之前 Hunt Good 周报介绍过的问答 AI 工具 Perplexity 在本周更新了增强模式,可以利用 GPT-4 模型作出更优质的回答,注册用户可以有 5 次使用机会。和 ChatGPT 相比,Perplexity 的一大优势在于它的回答速度非常快,而且每一条答案都有信源,如果你对答案不自信的话,可以点进信源链接再次确认。Perplexity 的团队由一群 OpenAI、MetaAI 等前员工组成,因此研发实力还是挺在线的。
如果你需要一款靠得住的「ChatGPT」,不妨来试试 Perplexity。🔗 https://www.perplexity.ai/一个月前,OpenAI 一起开放了 ChatGPT 和 Whisper 两款产品的 API,和前者相比,Whisper 获得的关注要少很多。但这不意味着 Whisper 无关紧要,恰恰相反,Whisper 是个非常强大的录音转文字模型,利用 Whisper API 开发的 WhisperJAX 可以在 10 分钟内把 2 个小时的博客转换成文字,你基本上可以和讯飞语记等主流转文字软件说拜拜了。WhisperJAX 托管在 Hugging Face 社区上,快来试试吧。🔗 https://huggingface.co/spaces/sanchit-gandhi/whisper-jax🧠 为什么 ChatGPT 能刷新历史,用两个月收获 1 亿活跃用户,挡都挡不住?2023年4月22日,陆奇在上海做小规模演讲,精彩纷呈,其中提到 ChatGPT 的魅力:
① 它封装了世界上所有知识。
② 它有足够强的学习和推理能力,GPT-3能力在高中生和大学生之间,GPT-4不光是进斯坦福,而且是斯坦福排名很靠前的人。
③ 它的领域足够宽,知识足够深,又足够好用。自然语言最大的突破是好用。扩展性也足够好。当然还是很贵,像2万多张卡,训练几个月这么大的工程。不过也没贵到那么离谱——Google可以做,微软可以做,中国几个大公司能做,创业公司融钱也能做。
🔗 https://mp.weixin.qq.com/s/_ZvyxRpgIA4L4pqfcQtPTQ
《New York Times》的记者 Farhad Manjoo 近日了他使用人工智能聊天机器人 ChatGPT 的体验。他指出,虽然 ChatGPT 还远远称不上完美,但他和其他媒体从业者已经找到了方法,利用它来克服写作障碍、帮助概括新闻故事、获取专家建议。虽然随着 ChatGPT 变得普及,会出现许多伦理和法律问题(例如如何确保可靠性并避免有偏见的内容)但 Farhad Manjoo 预测,ChatGPT 会像 iPhone、Google 搜索和互联网一样,将成为新闻记者又一个常用工具。🔗 https://www.nytimes.com/2023/04/21/opinion/chatgpt-journalism.html微软、Google 和亚马逊等大厂已经在人工智能开发方面进行了投资,但从行动来看,苹果似乎落在了后面。苹果并没有优先考虑生成性人工智能,这可能会改变该行业的游戏规则。由于这项技术需要大量的计算能力和云服务,苹果可能会因为行动缓慢处于劣势。人工智能技术在今天的苹果产品已是必不可少的存在,彭博社认为苹果虽然不需要参与这场生成式人工智能的战斗,但如果继续不作为,待到人工智能发展成后移动平台时,苹果可能就会陷于危险之中。🔗 https://www.bloomberg.com/news/newsletters/2023-04-18/is-apple-falling-behind-in-the-ai-race-against-microsoft-google-amazon?📱 AI 领域真正的竞争壁垒不在于数据,而在于生态的构建投资者王川在文章中指出,AI 是无限游戏,唯有构建最大最开放最丰富的生态者,让尽可能多的玩家加入自己的生态,帮自己分摊成本,才能真正占据战略制高点。以微软和 OpenAI 的合作作为例子,微软作为 AI 工具的主要提供商,在其生态圈中整合了各种工具,涵盖了桌面电脑、云服务和办公软件等领域。开发者一旦接触微软的工具,就会逐渐被吸引进其AI生态圈中。因此,想要在这个领域超越微软,需要靠大量市场数据的支持,而不是单凭「画饼」来忽悠投资者和用户。由前苹果员工创立的初创公司 Humane 日前发布了一款可穿戴设备,该设备具有投影显示屏和人工智能驱动的功能,可用作个人助理。该设备是由联合创始人 Imran Chaudhri 在 TED 演讲中演示,可以响应语音和手势命令,并且可以将屏幕投射到附近的表面上。
它包括一个摄像头,可以识别对象,并能够翻译口语句子。然而,它能否取代智能手机的便利性,还有待商榷。🔗 https://www.theverge.com/2023/4/21/23692368/humane-ted-talk-imran-chaudhri-wearable-screenless-device-voice-commands-projected-screen
AI 油画:繁华的大都市
Prompt: Create an expressionistic painting of a bustling city street scene, using dark colors such as black, gray, and deep blues to convey a sense of chaos and intensity. The painting style should feature bold brushstrokes and heavy textures that convey the frenetic energy and complexity of urban life. The dark color palette will emphasize the shadows and contrasts of the cityscape, creating a dramatic and moody atmosphere.点击「在看」
是对我们最大的鼓励