Redian新闻
>
500行代码打造AI搜索引擎!贾扬清周末项目登顶GitHub热榜

500行代码打造AI搜索引擎!贾扬清周末项目登顶GitHub热榜

公众号新闻
梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

只用500行代码搭出来的AI搜索引擎,登顶GitHub趋势榜。

作者:贾扬清的LeptonAI团队。

Lepton Search耗时一个周末打造,仅作为Demo演示而不是正式产品,只为向开发者展示“天下没有难构建的AI应用”

能理解中文但用英文回答

贾扬清事后感慨到:

这件事并没有那么复杂——我们刚开始时确实以为会更难。

另外,围绕这个Demo还发生了一些争议。

AI搜索引擎Perplexity创始人认为其参考了自己产品的UI界面,转发评论了一番。

贾扬清也做出回应,称无意进入这个市场,更多的是Demo展示以及宣传自家LeptonAI云服务,并且一开始就准备开源。

总之,两位大佬“友好”地一番交锋之后,Lepton Search修好bug后立即开源并且迅速获得社区认可

目前,已有偏学术的开源AI搜索引擎SciPhi使用贾扬清的代码完成升级。

500行代码的AI搜索引擎

要注意,AI搜索引擎整体上依然是一个复杂的项目。

Lepton Search之所以500行代码就能实现,正如贾扬清想要展示的,是因为今天的应用开发已经高度模块化

  • 大模型,调用了在自家云上部署的开源Mixtral-8x7b模型。

  • 搜索引擎,目前用了必应搜索的API。

  • 数据存储,用自家Lepton KV作为无服务器存储。

这500行代码其实只做到以下几点,就完成一个产品的雏形了:

  • 对大模型和搜索引擎的接口支持

  • 前端UI界面

  • 可缓存和可分享的搜索结果

除此之外,贾扬清还分享了开发过程中学到的一些经验:

  • 搜索质量确实非常重要,好的结果片段才能产生好的摘要。

  • 一点AI幻觉其实有助于填补片段中未涉及的“常识”。

  • 开源模型在文本摘要任务上已经做的非常好。

在后续与网友讨论过程中,贾扬清还认为“AI对话式搜索不会取代传统搜索”,还需要依赖传统搜索引擎的结果。

事实上,AI搜索目前正是行业的一个大热门方向。

代表公司正是前面提到的Perplexity,刚刚拿到7360万美元的A轮融资,估值超过5亿美元。

投资者中有英伟达、亚马逊,甚至谷歌AI大佬Jeff Dean和前YouTube CEO也不避嫌,以个人名义参与投资。

并且Perplexity已和部分浏览器厂商如Arc展开合作,成为默认搜索引擎的选项之一。

Perplexity网页版

更小一些的创业项目方面,比如面向程序员的devv_,面向学术的Consensus也各自受到垂直用户群体的认可。

国内大厂也是AI搜索的积极参与者,百度除了以文心一言插件的形式集成了AI搜索之外,还推出了独立的简单搜索App试水。

360也推出360AI搜索独立APP版,安卓版刚刚上线还是热乎的,连评分数量都还没够展示门槛。

昆仑万维的天工AI搜索则已推出了将近半年,其首页推荐问题通常紧追最新热点,很方便吃瓜。

AI搜索类产品在设计上大致分为三大类

谷歌和百度在传统搜索的页面顶部,以卡片形式展示AI生成结果。

必应、百度文心一言更偏重对话,搜索结果由AI总结提炼后呈现在多轮对话中。

其他产品大多遵循Perplexity为代表的新范式:

  • 搜索结果页面分为“参考链接-AI回答-相关追问”几个模块,并可多轮提问。

  • 搜索结果有历史记录,且可以对外分享

  • Copilot增强模式,AI理解问题后反向提问,引导用户补充搜索条件。

  • 个性化提示词,用于调整AI回答的风格以及格式。

正如Perplexity的CEO所说,他们的产品大获成功后,其模式已成为事实上的行业标准。

除了宏观的界面、功能之外,更细节之处如“付费功能的免费使用次数”都被一些后来者学走。

参考链接:
[1]
https://github.com/leptonai/search_with_lepton
[2]https://twitter.com/jiayq/status/1751633905890038232

—  —

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
OpenAI下周推出GPT商店;传苹果将在WWDC发布AIGC版Siri;英伟达投资AI搜索引擎创企丨AIGC大事日报1元=1700000tokens!清华系发布国产Mistral仅2B,老手机都带得动,GitHub一天斩获300+星贾扬清的500行代码,掀翻了Perplexity5.2亿的桌子?AI正在使全球代码质量下降!1.53亿行代码深度分析报告出炉分析了 1.5 亿行代码发现:AI 编程助手降低代码质量AI也造代码屎山!研究发现GitHub Copilot代码可维护性差,偏爱“无脑重写”而非重构复用已有代码今天终于解开了一个迷全球代码质量骤降,罪魁祸首竟是AI!1.53亿行代码深度分析报告出炉贾扬清盯上了提示词和AI搜索《中国爱与梦》&《骨刺》500行代码构建对话搜索引擎,贾扬清被内涵的Lepton Search真开源了徐英才新作《中国三行诗理论与技巧》前言小红书开源「InstantID」效果炸裂,被Yann LeCun点赞,迅速蹿上Github热榜只改了五行代码接口吞吐量提升了 10 多倍这个「AI 写真」开源项目火了! GitHub 一周暴涨四千星,Yann LeCun 亲自转发从 160 行代码到 200 亿安装量:Curl 的传奇故事500行代码构建AI搜索工具,贾扬清最新开源项目登顶GitHub热榜一场67万行代码的应用重构开发速率飙升20倍!GPT Pilot明星项目登Github热榜,从0开始构建AI贾扬清创业新动作:推出AIGC提示工具,几个字提示玩转SDXL,细节拉满一个全球 FHR & THC 搜索引擎【更新】百度5款大模型上新,更小更便宜!还可1分钟零代码打造Agent应用重磅!DoorDash、UberEats、Grubhub和Relay通通惨败女儿泪AI院士评选大瓜!图灵三巨头、贾扬清等38人当选NAAI终身院士,却无从查证!不到1000行代码,PyTorch团队让Llama 7B提速10倍大模型推理速度飙升3.6倍,「美杜莎」论文来了,贾扬清:最优雅加速推理方案之一不仅做GPT Store,OpenAI还要做AI搜索引擎|甲子光年不仅做GPT Store,OpenAI还要做AI搜索引擎AI搜索引擎再吸金5.28亿,英伟达贝佐斯入股,LeCun一众大佬夹道祝贺!网友:干翻谷歌搜索引擎对AIGC更加偏爱!AIGC会淹没UGC吗?分析了1.5亿行代码发现:AI编程助手降低代码质量JHU/WashU/UCSB三校放榜!JHU缩招13%!WashU录取缩水...回国的尴尬(一)这才是咱们想要的搜索引擎!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。