Hunt Good 周报|ChatGPT 的挑战者,出现了!科技2023-01-15 03:01十年前,移动互联网充满朝气,每天都有新芽从智能手机的沃土中长出。十年后,我们早已习惯了 Web 2.0 社会,相关技术也基本发展至中后期,我们中的极少数,正在寻找 Web 3.0 的曙光。Open-AI/MetaVerse/NFT/Stable Diffusion/DeFi 云云,一众新词扎堆涌现,仿佛十年前的蓬勃光景再度重现。新的工具正摩拳擦掌,蓄势待发,没有人甘于落后。欢迎大家来到第七期 Hunt Good 周报,跨入数字工具次世代。Happy Hunting!Hunt Good 导读Bento,将任务塞进「便当」Readwise Reader,收集一切Luma AI,iPhone 摄像头不光能拍照和扫码了VALL-E,机器学舌NeevaAI,ChatGPT 挑战者Bento,将任务塞进「便当」又双叒叕是一款 To-Do List 工具,这类型的软件大家早已见惯不怪了,为什么还有新人踏足这一品类,如果不能整出点新活,那一定会被时间冲刷掉,消失在我们视线之外。Bento,这是「便当」的英文,这款 app 提议我们将日常工作先归类,再执行,而不是一上来就开干,在这套产品逻辑背后,其实开发者是想用这款 app,培养我们凡事「三思后行」的思维。盲目开干不可取,先归类,每天事务如此地多,先分个轻重缓急,才不会像无头苍蝇那样到处碰壁。它名字叫便当,交互上也像极了我们在给便当盒填充食物时的操作。一般来说,便当盒有隔区,这放肉食,那放米饭,Bento 也是如此,他们借用了「便当理论」,在填写待办事项之前,就要求用户先把任务拆分成「小/中/大」三种类型,他们对这三种类型任务也有自己的定义。小任务:容易解决,能帮你积累起工作自信;中型任务:需要一定时间精力去处理,但难度不大;重度任务:包括会议在内的,需要十分集中精神去处理的事项。这一套归类思维,便是 Bento 的灵魂,值得我们学习借用,毕竟对于这么一款收费软件而言,不是所有人都愿意掏钱尝试,但每天当你往其他 To-Do 清单填写待办事项时,先想想执行次序,便也能达到 Bento 所能实现的效果。Readwise Reader,收集一切Readwise 是一款书摘软件,从它脱胎而来的 Readwies Reader,则是一款阅读器。用它可以看 RSS、PDF、YouTube 视频,你可能会说,这不都是常规操作吗?但它把这些功能都做得更进一步。可以在 RSS 网页标注并留下评论,信息采集爱好者必备功能;可以阅读 PDF 内容,同样可以进行批注;看 YouTube 内容时,可以将视频内容压缩成文字(自动输出逐字稿),然后划线收集加批注,大幅压缩视频内容的信息密度。不过该功能目前仅支持英文视频。如果你将 Twitter 账号进行关联,就能保存 Twitter 的信息流内容,方便进行信息采集,电子邮件、电子书亦然(支持 Epub 格式)。它的作用在于,尽可能将内容都采集到一个地方,方便查阅的同时,自己也可以从中找到毛线头,进行自己的思考作业。同时它鼓励用户使用快捷键进行操作,一定程度上提升了桌面端采集信息的效率。Luma AI,iPhone 摄像头不光能拍照和扫码了苹果从 2017 年的 WWDC 起,便推出了 ARKit 增强现实开发套件,以供开发者针对 AR 场景开发应用,此举也被视为给未来的元宇宙硬件产品铺路。而 2020 年,苹果在 iPad Pro 和 iPhone 12 Pro 上加入的 LiDAR 激光雷达镜头,则让移动设备也有了采集物体 3D 空间信息的能力。经过两年的发展,手机也拥有可观的建模能力,于是 Luma AI 应运而生。不得不说,Luma AI 的建模能力,初见细节已经非常细腻,配合现实世界的光影反射效果,网友惊呼:现在游戏的画质都那么高了吗?在 Twitter 上,有网友利用 Luma AI 给摩托车手建模,放在游戏画面中,剪成伪赛车游戏视频,足够以假乱真。还有作者将 Luma AI 的扫描图成像画面剪成 MV,颇有一番风味。有意思的是,Luma AI 的创始人正是从苹果的增强现实及计算视觉部门出来的,知己知彼,因此 Luma AI 在 iPhone 上的效果也十分理想,乍看之下,它所完成的扫描精度,可以算得上是「照片级」了。不过放大之后,还是会露馅,尤其是扫描毛绒玩具这类材质表面凹凸不平的物体,放大后会发现起表面变得模糊不清,一束束毛发变成了一坨不可名状物。不过随着手机算力提升,得到更高清的模型只是时间问题罢了,在 Luma AI 的引领下,我觉得这个要求并不算难。VALL-E,机器学舌微软早前投资了 OpenAI,近期更是传出将跟投 100 亿美元,后续必然还会加大投入,因为微软已经打算将 OpenAI 所研发的人工智能技术融入到旗下产品的方方面面。而微软在 AI 领域的最新成果是一项刚刚发表的论文,其中宣布了人工智能语音系统 VALL-E,它的最大特性是「鹦鹉学舌」。VALL-E 可以对一段人类录音进行学习,录音时长只需超过三秒,它就能模拟出这个人的声线,输出其他语音内容,就连口音都能复刻。目前这项技术尚未生成产品,只在 Github 上阐述了模型概要以及一些语音示例。VALL-E 尚未完善,在一些示例中,它的模仿力很是强悍,与原声近乎相同;但在另一些示例中,人类原声带有明显的口音,而它生成的语音却字正腔圆,发音十分标准,容易露馅。VALL-E 越接近真人,我心里越是担心,如果它落在坏人手上,是否会成为诈骗利益链条中的一环呢?如果人类未来分辨不出电话那头的是真人或是 AI,那我们是否能够借助技术,帮我们进行甄别呢?对此,VALL-E 也给出了自己的解决方案:增加了道德声明,后续用协议去规范使用用途,虽说聊胜于无,但有了一定约束,也能让一些「有贼心没贼胆」的人,回头是岸。此外,微软除 VALL-E,还将把 ChatGPT 引入到 Bing 浏览器,将 OpenAI 的一些技术与 Office 套件融合,可见 2023 年「AI + Everything」的趋势,将愈演愈烈。NeevaAI,ChatGPT 挑战者都说 ChatGPT 是下一代搜索引擎的雏形,而如今一个搜索引擎做出了另一个「ChatGPT」,那就是 Neeva。两年前 Neeva 被评选为 2021 年度百大最佳发明之一,就因为它没有广告,一班从 Google 出来的年轻人,建立了这个没有广告的搜索引擎,采用订阅制模式,一直活得好好的。▲清爽的搜索界面他们号称搜索结果更纯净,也更准确。如今他们将这一优势延续到问答平台上,推出了 NeevaAI。用法跟 ChatGPT 类似,界面只有一个文本框,用户把问题输入进框,数秒后它就能生成一个答案。与 ChatGPT 不同的是,NeevaAI 会把回答里出现的内容来源统统标注出来,有据可依,可追溯来源,它生成的答案更有说服力。NeevaAI 号称每日抓取数以亿计的网页内容,实时更新,这点比 ChatGPT 要先进一点。也正是这一点,NeevaAI 应用场景也更广。当然了 ChatGPT 一旦开放联网功能,两者孰高孰低,就不好说了。点击「在看」是对我们最大的鼓励微信扫码关注该文公众号作者戳这里提交新闻线索和高质量文章给我们。来源: qq点击查看作者最近其他文章