Redian新闻
>
获1000万美元捐款,用于代码重构、上云,论文预印版平台arXiv「好起来了」

获1000万美元捐款,用于代码重构、上云,论文预印版平台arXiv「好起来了」

公众号新闻

机器之心报道

编辑:泽南

上云、代码重构一起来。


对于节奏越来越快的学术研究领域而言,arXiv 是非常重要的论文预印版平台。和维基百科一样,它是个非营利性机构。


当地时间本周四,康奈尔大学科技校区(Cornell Tech)宣布了 arXiv 获得巨额捐款的好消息。



作为一个非营利数据库,arXiv 是所有人均可以免费访问的,长期以来一直依赖人们的捐赠。康奈尔科技校区宣布,西蒙斯基金会和美国国家科学基金会(NSF)已提供了总额超过 1000 万美元的赠款以支持 arXiv。


据介绍,这笔资金将使这个拥有超过 200 万篇论文的研究存储库迁移到云端,并对其代码进行现代化改造,以确保更高水平的可靠性、容错性和可访问性。


应该过不了几天,我们加载 arXiv 上 PDF 的速度就会加快,或许可以直接在网页上就能看论文了。


「我非常感谢西蒙斯基金会和美国国家科学基金会的巨大支持,」康奈尔科技校区杰克和里拉・尼夫西院长兼副教务长 Greg Morrisett 说道。「这项投资可以确保 arXiv 服务继续扩大规模,为更广泛的受众提供服务,并更好地为科学界服务。」


康奈尔科技校区计算机科学教授 Ramin Zabih 表示:「通过对代码库进行现代化改造并过渡到云端,我们正在加强 arXiv 的基础设施建设,并确保它持续成为学术出版物共享方面的创新源泉。」


arXiv(发音为 “archive”)于 1991 年由当时的洛斯阿拉莫斯国家实验室物理学家 Paul Ginsparg 博士创立,他当时希望对大约 100 篇研究论文进行分类。当论文如潮水般涌来之后,他尝试借助计算机程序来解决问题,据说他「通过参加十多年的机器学习研讨会」学会了如何编写该程序。


Ginsparg 现在是康奈尔大学的物理和信息科学教授。


该论文平台现在由康奈尔大学图书馆负责维护和运营,是一个巨大的学术论文预印本存储库,收集了已发表和大量尚未经过同行评审过程,或不打算在参考期刊上发表的文章。


目前 arXiv 涵盖的分支学科已包括自然科学和社会科学的多个领域,包括物理、数学、计算机科学、量化生物学、量化金融、统计学、电气工程和经济学。截止到 2022 年底,在 arXiv 上的投稿已经超过了 220 万篇。



由于 arXiv 的吸引力很大,很多领域的研究人员会在学术顶会或者期刊没有录用之前,就把自己的最新研究成果「提前发表」到这个平台上。一般人们认为这样做的好处在于「占坑」和宣传:既可以保护自己的 idea,又能扩大宣传提升学者自身的影响力。与此同时,这种做法也大大加快了学界信息传播的速度。


相比之下,即使在今天节奏较快的 AI 领域,无论会议还是期刊论文从投稿到最终可见都需要数月时间的等待,有时在此期间甚至已经出现了新的方向。


因此,arXiv 逐渐成为了很多学术领域,如数学和计算机科学的首选「投稿」地点。时至今日,经常刷 arXiv 成为了不少学者的习惯。在人工智能领域内,很多被 NeurIPS、CVPR、AAAI 等顶会收录的文章曾被提前投放在 arXiv 上获得曝光。另一方面,由于其没有非常有效的筛选机制,平台上也有很多质量较低的论文,这或许会是获得新注资后 arXiv 尝试改变的方向。


大多数时候,是否被重要期刊会议接收是评价论文质量的重要标准。不过在 arXiv 出现后,也有很多被顶会遗漏的论文在学界发挥了重要的影响力,收获了众多引用。在人工智能领域里,我们可以轻易列举出一些在 arXiv 上出现且家喻户晓,但曾被 AI 顶会拒稿的文章,比如 YOLO、transformer XL、Dropout 的研究。


计算机视觉领域里著名的目标检测算法 YOLO,其论文至今被引用数已经超过 4 万,不过当初它曾被 NIPS 拒稿,修改后转投 CVPR 2016 获得了接收。



2012 年,后来的图灵奖获得者 Geoffrey Hinton 在论文《Improving neural networks by preventing co-adaptation of feature detectors》中提出了 Dropout。同年,AlexNet 的出现开启了深度学习的新纪元。AlexNet 使用 Dropout 显著降低了过拟合,并对其在 ILSVRC 2012 竞赛中的胜利起到了关键作用。可以认为如果没有 Dropout,深度学习的大发展可能会被推迟数年。


不过这篇论文被 NIPS 2012 拒绝,现在还是 arXiv 上的预印版状态。



承载了先进科学希望的 arXiv 平台,未来会发展成什么样?


康奈尔大学表示,arXiv 开发的下一阶段将包括雇用更多软件开发人员来支持现代化工作。与此同时,计算机科学系的教职员工将在 NSF 的资助下开发新的搜索和推荐技术,这些技术计划用于支撑 arXiv 的大型用户社区,且会得到最先进的隐私保证的支持。此外,arXiv 将通过生成 HTML 和 PDF 版本的内容,为视障人士提供更好的访问。


1000 万美元的资金将很大程度上增加 arXiv 的实力。相比之下,arXiv 在 2021 年的总花费为 242 万美元。


在收获捐赠新闻发出后,人们纷纷叫好,并期待预印版平台未来的进化。



参考内容:

https://news.cornell.edu/stories/2023/10/research-repository-arxiv-receives-10m-upgrades

https://news.ycombinator.com/item?id=37949656

https://medium.com/nautilus-magazine/what-counts-as-science-76ebd1f5d403




© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
雷军捐款13亿后,易中天称“我深感惭愧,13块都没有”,96字诗却“换来”100万元捐赠George Church联合创办,波士顿TCR初创获1610万美元融资,并达成新合作实战总结|记一次迭代需求中的微型代码重构地方高校,获亿元捐赠!陶哲轩:我用GPT-4辅助证明不等式定理,论文还会上传arXiv度假加勒比(七) 波多黎各(Puerto Rico)爆火AutoGPT获1200万美元融资,GitHub已有151k星时隔多年!中国版平准基金重出江湖!会有怎样影响?扎克伯格夫妇向枪击案华人受害者,捐款100万美元打败比尔·盖茨的宁波老头,向浙大捐款 1000 万美元《外婆的道歉信》:生活治愈的,是愿意好起来的人微软,用最开放的云,玩最野的 AI凉凉!开学了,论文进度0,某研三医学生在组会上被公开处刑,结果......又大又丑的 MPV「保姆车」, 成了车企的新战场AI机器识别突破登Nature封面,加速第四次工业革命,论文一作为浙大校友CCTV「国家宝藏」权威出品!集合100枚馆藏文物珍邮,还赠纪念金砖,限量发行!500万人次求助,800亿元捐赠:慈善法修正可否终结个人求助争议外交部:推动中美关系真正稳下来、好起来学历通胀之下,论文成了一门生意网易互娱出海之旅:大数据平台上云架构设计与实践4K画质3D合成视频,渲染速度提升30多倍,论文作者带你解读新研究《蛤蟆先生去看心理医生》:不要相信人生本该如此,你会好起来!用一个月重构了同事写的烂代码,我总结了8条重写烂代码的经验!长江商学院刘劲:只要提振民营企业家信心 经济一定会好起来小米澎湃OS首个开发版开始推送:底层重构、安装包大小6GB华人餐馆枪杀命案家属仅收到3000美元捐款好起来了!大温各城市将建设新的公交线路!政府公布10年计划!移民生活(23)一个白领女子的诉讼之路AMD RX 7800 XT 显卡外媒评测:略强于 RX 6800 XT《山水中国美》&《他离开我认输》Erklärung zur Zusammenarbeit运营商内鬼被抓!搞了8000万个手机号注册微信账号售卖,用于电信诈骗、网络赌博等活动…夜里银行懵了!华裔男子伪造100万美元支票存入银行,已经取走50万美元红色日记 6.21-30
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。