Redian新闻
>
连中两篇WWW顶会,我的经验分享!

连中两篇WWW顶会,我的经验分享!

公众号新闻


MLNLP社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。
社区的愿景是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进步,特别是初学者同学们的进步。
转载自 | Datawhale
作者 | 鸣也,中国科学院大学,Datawhale成员
很幸运能在WWW23中稿两篇论文,作为22年中旬才开始做深度学习方面的科研新手来说,给即将入门科研的人一些我总结的经验和技巧。
主要分成这几点来介绍:
  1. 科研前的选题
  2. 科研中的耐心
  3. 科研后的延续
  4. 总结
  5. 工作简介

科研前

作为一个深度学习小白,我之前科研的主要方向是矩阵优化和统计优化(一个偏数学的方向),后面因为一些原因转到图神经网络的组里,主要做深度学习和数据挖掘。这时候我们需要思考自己的优势,我们不像计算机科班的同学那样,各种代码的框架信手拈来,代码的实现轻而易举,我们有的是一些虚无缥缈的数学功底。
在阅读图神经网络的各种相关文献的时候,发现文章一般有两种风格,一个是解决问题的“技术报告”,另一种是理论丰富但是实现起来较为容易的。我作为数学系的学生自然就选择了后者 (因为不会写代码5555)。确定了论文风格之后,再加上同期还在参与一个图谱理论的讨论班,所以就开始着重阅读一些偏理论的图谱网络的文章。
文献的积累够了之后,我们就需要思考整个领域的缺陷和可能可以发展的地方,也就是常说的idea。我认为文章大概又能分成几种,一种是占坑类型的(A+B),一种开创类型的,一种是深挖类型的。而我当然就是选择从A+B中进行深挖,往往最好下手(要从科研质疑的角度看待每一篇论文,而不是学习)。

科研中

确定了科研题目之后,就会遇到证明猜想和代码实验的困难。对于我的选题,代码的部分往往并不困难(难的我也不会写呀5555),所以我只有一些对数学证明的感触。每篇文章我往往都会写一到两个小定理或者性质命题,我们需要对我们新的设定做一些简单的假设,然后在一些特殊情况下,构建起对于整个模型的认识,然后根据一些参考文献,给出我们的猜想的命题,比如收敛,收敛性,鲁棒性...证明的方法虽然大相径庭,但一般都是关于矩阵论和随机过程的东西,强相关的参考文献中的证明过程一定要仔细过一遍,因为往往能学到这个领域的“套路”。
对于代码实验,除了将自己的想法实现出来,我也有一些小小的心得,那就是一定要和合作者一起把代码review一遍(因为我写的都是bug5555),遇到效果不佳或者提升并不明显的时候,不要轻易放弃,不一定是你的idea不可行,可能是框架的一些别的模块和我们的方法不适配,这就需要经验的积累了,也是科研经验很重要的一部分。

科研后

很多人会好奇科研后是什么意思,其实就是如果对这个领域进行进一步的深挖,甚至是在这个课题做完之后如何进行更多的改进。这个一般在论文收尾或者修改论文的时候思考。我往往会在大规模跑实验和写论文的时候,阅读一些其他小领域的文章,粗略的了解一些不曾触及的知识,这对于idea的迸发和科研的推进应该是非常有用的。

总结

关于2022年整个科研过程,我觉得有几点非常重要。
(1)打好数学基础,不要贪图看论文的数量,看一篇就要看懂一篇;(2)多和伙伴交流,这真的很重要很重要,多听听别人的建议和想法会让你受益匪浅,也会脑洞大开hhh;(3)不要局限自己的领域,不要功利性的看一些论文,对于和自己科研方向看起来无关的知识也可以适当的了解;(4)除了论文的理论和结果,论文的写作也是非常重要的,往往一篇文章修改的时间甚至比写作还长,需要耐心理清楚逻辑让审稿人和读者明白你的意图。

工作简介

最后简单的介绍一下我们在WWW23中稿的两篇论文的主要内容。
(1)图神经网络是处理图数据的强大工具。然而,现有的图神经网络面临着over-smoothing和over-squashine的挑战。我们提出了一种新的基于曲率的拓扑感知的Dropout采样技术CurvDrop。在该技术中,我们将离散的Ricci曲率整合到图神经网络中,以实现更具表现力的图模型。同时,这项工作可以通过量化图中的连接和使用图中的社区结构等结构信息来改进图神经网络。因此,我们的方法可以统一解决over-smoothing和over-squashine的问题。在多个公共数据集上的实验验证了所提方法的有效性。
(2)马尔科夫逻辑网络(MLN)是一个强大的概率逻辑推理的统计建模框架。尽管MLN很有效,MLN的推理存在效率问题。即使是最先进的MLN引擎也不能在开放世界的环境下扩展到中等规模的现实世界知识库。(开放世界指的是知识库中所有未观察到的事实都需要预测。)我们这篇文章中,通过关注某类具有足够表现力的一阶逻辑规则,我们开发了一个高效的MLN推理引擎,名为MLN4KB,可以利用知识库的稀疏性。MLN4KB享有相当强的理论特性;它的空间和时间复杂度可以比现有的MLN引擎小上指数倍。在合成和真实世界的知识库上的实验证明了所提方法的有效性。在开放世界环境下,MLN4KB比现有的MLN引擎快几个数量级(在某些数据集上快10^3$倍以上)。在没有任何近似技巧的情况下,MLN4KB可以扩展到包括WN-18和YAGO3-10在内的真实世界的知识库,并在没有任何花哨的情况下达到相当的预测精度。而且我们以一个名为MLN4KB.jl的Julia包的形式实现了MLN4KB。该包支持MLN引擎的所有基本功能,包括最大后验(MAP)推理和学习规则的权重。我们之后后开源MLN4KB.jl。

技术交流群邀请函

△长按添加小助手

扫描二维码添加小助手微信

请备注:姓名-学校/公司-研究方向
(如:小张-哈工大-对话系统)
即可申请加入自然语言处理/Pytorch等技术交流群

关于我们

MLNLP 社区是由国内外机器学习与自然语言处理学者联合构建的民间学术社区,目前已经发展为国内外知名的机器学习与自然语言处理社区,旨在促进机器学习,自然语言处理学术界、产业界和广大爱好者之间的进步。
社区可以为相关从业者的深造、就业及研究等方面提供开放交流平台。欢迎大家关注和加入我们。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
【友情转发 - 活动报名】创新,创业,创未来!青年创业者经验分享!【Zoom活动】​上海美国中心特殊奥林匹克组织杰出经验分享:融合体育助力教育,12月15日,周四,19:00-20:30经验分享!突然闻到煤气味,怀疑是煤气泄露怎么办?管用!!平嫂海外留学期间防疫经验分享,这五大预防法宝大家收藏备用吧~李江教授:肺动脉高压的药物治疗经验分享与思考经验分享|我在德国上语言班的一天短歌行裁员大潮下,如何自保?过来人的经验分享,让人少走好几步弯路ACCD王牌专业汽车设计上岸学长经验分享!小基数不挨饿减肥,2个月瘦10磅,半年无反弹。我总结了这几点经验分享给大家转岗B端产品经理,跳槽涨薪30%,无保留经验分享纠结着,兴奋着SDE讲座 | 搞定面试!业内大咖8年独家经验分享!【惊了】大温一男子街头连中两枪,警方“抱歉,我们认错了”!多大本科,放弃Ivey商学院,舒立克商学院录取经验分享~如何准备心理学硕博面试?导师经验分享懵了!留学选错专业?NYU转专业经验分享!今天的午餐和晚餐发质变好了!经验分享收好新冠病毒中招后,如何足不出户拿到特效药?亲身经验分享!拿下6家offer经验分享:刷LeetCode这件事,其实不靠努力!全家中招「甲流」,过来人经验分享!除了吃奥司他韦,这件事千万别大意HC告急!刷了不足100题,极速上岸Tiktok经验分享历年物理碗参赛者经验分享,备赛时不要错过这些物理学书籍和网站!!办Q2宝藏经验分享!洛杉矶领事馆恢复面签第1天,大排长龙!有人7点就来了......斯洛文尼亚布莱德湖(Lake Bled),清晨赏景干货!CFA女子奖学金申请成功经验分享曲江涛:电影人物塑造经验分享财务估值建模实操经验分享(视频演示)猫儿的事ACCD, SAIC, PRATT, CCA, RIT 产品设计大满贯学姐经验分享!!!我的经验分享:在美开公司、创业恰饭顺便搞身份来自一线技术人的经验分享|如何写出让人眼前一亮的述职报告这也行?惊了!大温一男子街头连中两枪,警方:“抱歉,我们认错了”!历年物理碗参赛者经验分享:不要错过这些备考资料!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。