Redian新闻
>
Feep! search:一款面向程序员的搜索引擎,收录信息超2900万页!

Feep! search:一款面向程序员的搜索引擎,收录信息超2900万页!

公众号新闻



  新智元报道  

编辑:Cris 好困
【新智元导读】想让检索代码不再「大海捞针」?就用「Feep! search」。

一款专门面向程序员的搜索引擎,2021年9月才开工,却收录了超过2900万页信息。这样的「编程神器」,你愿意尝试吗?

这两天,草根开发者浮士德发布了一款名为「Feep! search」的搜索引擎。只要在检索框中输入你想找的程序名称,分分钟便能检索出成百上千条成熟代码。

虽然这款「编程神器」还存在着不少问题,却已经令不少苦兮兮的程序猿、程序媛们心驰神往,堪称今年「1024」最好的礼物。

Feep! search


「Feep! search」是一款程序员专用的网络搜索引擎,主要用于编程资源的查找。

虽然名称采用了与雅虎(Yahoo!)相似的结构,但与美国门户网站的明贬实褒(Yahoo原意为乡巴佬)不同,「Feep」在《新黑客词典》中特指「终端发出的柔和电子铃声」,尾部的「!」则代表了想要为用户提供令人难忘的服务。

目前,「Feep! search」能够检索的信息源,包括DevDocs、Hacker News、Kiwix、Stack Exchange等,甚至还包括一些已索引但未爬网的链接,信息总量超过2900万页——这甚至比谷歌1998年推出的第一款搜索引擎还要多(2600万页)。

据网站作者浮士德介绍,「Feep! search」在检索时会查找它所存储的所有信息,对一些数据进行少量排序,并填充到搜索网站的结果页中。

数据混洗位主要用Node.js编写,许多shell脚本将所有内容粘在一起,排名和全文搜索则由ElasticSearch提供支持。这一切都在他家客厅的HP微型服务器里运行。

位于浮士德客厅的「Feep! search」服务器

以程序员们最经典的上手程序「hello word」为例,仅用时27毫秒,「Feep! search」那简洁而不简单的界面便检索出超1万条结果。你可以从中轻松找出许多能够实际运行的成熟代码。

而且,搜索结果的信息来源,也是相当丰富的。

在浮士德的帖子下,不少网友表示「Feep! search」真乃程序员的福音:

「很棒的作品。(我)在同一主题不同变体的三次搜索中得到了一些好的答案和有用的链接。」

也有部分网友在体验后发现了问题:

「好主意,但现在的搜索很糟糕。对『django signals』进行检索,第一页得到了非官方的结果,第二页(1)上的所有链接都断了。搜索『go cobra』则根本没有官方文档。」还在最后提出了一些改进建议。

美中不足


就连作者自己也承认,因为尚未设置任何搜索运算符或高级搜索语法,导致引擎的搜索结果相当多变,搜索结果的排名不能很好地获得展示。
不过,对于一些检索时的常见问题,作者也在「Query help」页面进行了备注:
  • 单词被词干化(例如「walking」、「walk」等都将被转换为「walk-」),并逐个搜索。目前还没有任何方法可以关闭这个功能,或者搜索完整的短语;
  • 非字母数字字符将被忽略(这意味着你不能搜索符号运算符之类的东西。这对于一个专门为程序员设计的搜索引擎来说非常尴尬。这也是我要着重解决的问题之一);
  • 语句的理解非常肤浅:它不寻找同义词,也不理解同一个词在不同的上下文中可能有不同的含义(这与谷歌截然相反,即使你有非常具体的想法,谷歌也会尽力猜测你的其他意思。哪种方法最有用取决于你寻找的方式)。改变查询的措辞可能会得到一组完全不同的结果;
  • 如果没有搜索到你要找的内容,请尝试添加或删除单词。有时看似微小的调整都会产生巨大的差异。您需要的结果可能就在某个地方,即使可能很难找到;
  • 有时候,好的结果有些被埋没了。建议您多浏览几页,看看要找的内容是不是在后面。

值得一提的是,每页检索结果的末端还提供了Google、DuckDuckGo、Bing和Marginalia四种其他搜索引擎的链接,一键即可进入对应词汇在各大引擎中的检索结果。

作者特别向我们推荐了一款独立的DIY搜索引擎Marginalia Search。与「Feep! search」类似,这是一款专注于推荐「你可能不知道网站」的搜索引擎。这个搜索引擎中的软件都是定制而成,所有的爬网和索引都在内部完成的。

小人物的大梦想


「Feep! search」的作者沃尔夫冈·浮士德(Wolfgang Faust)是一名专业软件开发商和业余爱好者。

通过浮士德的个人网站我们可以了解到,虽然曾发表过大大小小上百项程序,但他却是一名不折不扣的草根开发者。

正如浮士德个人网站的Slogan「我做了很多不同的事情」所言,2011年至今,他在GitHub上共更新了111条作品,但账号目前也只有25个粉丝。一款名为「yaml-multiline」的开源软件,总计获得过216颗星和16次引用——这已是浮士德开发生涯的扛鼎之作。

不过,他在两大论坛Hacker News和Reddit上却分别收获了4,004和3,712次「功德」,具有极强的表达欲望,也可以说非常努力了。

不管怎么讲,能制作出一款收录接近3000万页信息的搜索引擎,都是一项十分了不起的成就。

毕竟当年Google刚推出时,也同样问题重重。

参考资料:

https://search.feep.dev/about/

https://news.ycombinator.com/item?id=33494221

https://www.wolfgangfaust.com/




微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
“人生搜索引擎”融资7千万估值5个亿,回溯你在网上做过的一切,网友:《黑镜》成真了李易峰丁丁历险记AWS工程师辞职创建Tensor Search引擎,即插即用HuggingFace版CLIP模型2022年全球程序员收入报告出炉:国内程序员人均56w年薪。。网友说:我拖后腿了!与糖共舞—26Hunt Good 周报丨Notion 要用 AI 帮你写笔记 / Rewind 搭建「人生搜索引擎」雏形1024程序员节:35岁是程序员的终点吗?55年女少将李贞评衔资料ChatGPT与搜索引擎合体,谷歌都不香了,LeCun转发|在线可玩张俊林:ChatGPT会取代搜索引擎吗?谁说搜索引擎静悄悄?——谈谈谷歌、夸克及其他从技术原理上看,ChatGPT会取代搜索引擎吗?谷歌要完?ChatGPT会成为下一代搜索引擎吗?ChatGPT爆红,百度、搜狗、360等搜索引擎尴尬吗?ChatGPT整合进必应,向谷歌宣战!微软联手OpenAI引爆搜索引擎革命从程序员到CEO,GGV首届1024程序员节活动回顾美丽与野性共存的冰川国家公园(2)高线步道的美丽,野性与挑战ChatGPT会成为下一代搜索引擎吗?来和UCSB李磊一起聊聊 | 直播预告不用关键词也能精准搜索,新AI搜索引擎火了,网友:刚用5分钟就设为默认Hunt Good 周报|《黑镜》成真!这款 app 做的「人生搜索引擎」火了劳动节看明星老爷车【忽然一周】中国是欧盟最大的玩具供应国;泡泡玛特耗资579.99万港元回购30万股;“羊了个羊”商标申请信息超900条程序员何苦为难程序员1024程序员节,细数“改变世界”的程序员们Hunt Good 周报|智商 83 的 ChatGPT,不想只做搜索引擎视频搜索越来越好,会颠覆传统搜索引擎吗?G-Research:ICML 2022论文推荐这家人生搜索引擎公司,可以回溯你在网上做过的一切四年又四年,苹果搜索引擎要“胎死腹中”?太疯狂了!1024程序员节,致敬千万程序员!京东图书4折起...GAN、扩散模型应有尽有,CMU出品的生成模型专属搜索引擎Modelverse来了这家人生搜索引擎公司,可以回溯你在网上做过的一切 |【经纬低调分享】英国大学向学生发补贴! 按揭利率飙升至14年来新高. 无广告搜索引擎进军英国苹果自研搜索引擎进度或滞后 团队人才流向谷歌‘Sleeping Assistants’ Are Talking Chinese Insomniacs to Sleep
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。