Redian新闻
>
4-6个月产出论文有多难?

4-6个月产出论文有多难?

公众号新闻

科研的本质:解决问题,创造新事物(新问题、新方法、新发现、新理论)


科研论文的关键的体现在于将所得结果详实记录并进行科学分析后,总结成果写成论文由同行评议认可后发表。


科研的完整过程


那么如何在4-6个月内产出论文呢,这次我和一些担任AAAI,ACL,EMNLP等多个会议期刊的审稿人聊了聊,给大家准备了以下攻略,希望对大家有所帮助。


扫码0.01元领取

《4-6个月产出论文实操手册》


一、如何调研确定topic


什么是好的topic,就如同寻找网易云音乐的小众歌手:


01:越直观简单越好:简单意味着自己领域知识的学习成本低,例如NLP的文本分类,CV的人脸识别


02:越小众越好:越小众,说明研究的人越少,研究竞争难度低,例如医学和CV结合的方向,NLP和生物信息(例如药物挖掘)的交叉方向


(一)如何调研确定topic


如何去寻找小而美的topic,要走金山里面找金子。


step0: 确定含金量最高的信息源


翻所在领域近三年的顶会文章,NLP领域主翻ACL/NAACL/EMNLP的顶会文章,CV主翻CVPR/ECCV/ICCV的顶会文章,机器学习主翻NIPS/ICLR/ICML,图与数据挖掘主翻KDD/WWW/SIGIR


step1: 只看论文标题,确定10-20篇准备看摘要的论文


浏览找到顶会文章的paper title list,根据直观易懂且小众原则排序选出10-20篇论文看摘要。


step2: 看10-20篇准备看摘要的论文


找到3-5篇摘要看的懂的论文,仍然是直观易懂且小众排序原则。


step3: 精读3-5篇论文,确定研究的topic,找到一个觉得我可以的topic


精读3-5篇论文,对每篇论文所涉及的topic回答下面几个问题:

  • 这个topic目前3-5个公认baseline以及公认的evaluation datasets是什么;

  • 这些baseline是不是卷到特别复杂;

  • datasets是不是刷到特别饱和;

  • 代码是不是自己很快可以看懂一键run起来。


扫码0.01元领取

《4-6个月产出论文实操手册》



(二)如何确定idea


空想无用,实践才能出真知。


step0:平地不好起高楼,找到好的代码


确定topic之后,搜索相关baseline的开源实现代码,评判原则readme完善,看的不吃力,跑起来容易。


step1:纸上得来终觉浅,觉知此事要躬行


确定好的开源代码实现后,对比原始论文,把对应的实验都跑一遍,看看能不能复现论文实验效果


以及对实验的数据集多做error analysis和case study,反复实验和分析数据,洞见到提升点,能找到提升点,自然就可以产出idea。


step2: 多多讨论,寻求合作


独立科研能力虽然重要,但是对于小白更需要找到好的合作者和引路人,和相关论文代码作者多发邮件讨论问题,甚至可以邀约合作。


也可以多找靠谱的师兄姐同学讨论,一个人干很容易迷茫。


在讨论和合作中,可以更加明确idea,当然记住idea也要谨慎透露,防止idea被剽窃。


扫码0.01元领取

《4-6个月产出论文实操手册》


二、如何多快好省做实验


工程思维,快速迭代。


step0:0-1 阶段,快速验证想法


万事开头难,确定idea之后,要快速实现idea验证想法没有问题,如果没有问题,自然一顺百顺。


如果有问题,解决方法如下:


首先,最小迭代原则,自己的idea最好是在基础代码上的逐步迭代,确保实验不顺需要分析考虑的对象最少化。


其次,勇于跳坑,如果某次的实现发现经过一段时间努力后没有效果并且分析不出,及时跳坑,考虑换一个代码baseline实现,甚至要重新review讨论idea。


step1: 1-10阶段,完整solid的实验方案


实验越全面翔实,论文中稿概率越大,一个统计数据method+实验部分接近论文页数限制,基本可以中稿。


开了好头,接下来是最见逻辑和思考的阶段,初步想法验证后,需要扩展实验和分析。


如何扩展实验,借鉴baseline对应论文的实验setting确定自己要做哪些ablation study实验以及补充哪些数据集的实验


如何进行分析,分析最关键的是要解释出自己的实验效果如何好,一般针对自己argue的几个点,给出定量的曲线统计实验或者定性的case study实验。


扫码0.01元领取

《4-6个月产出论文实操手册》



三、如何翻过论文写作的山


先写再改,尽量降低自己的学习曲线和执行难度。


Tips:这份操作手册的核心就是以平滑的学习曲线完成自己的第一篇论文,一回生二回熟,一回生很重要。


step0: 模仿式写作


模仿实验中对比baseline的几篇文章组织和写作,优先把intro method和experiments部分写完,这一步先把内容都堆砌上再说。


step1: 梳理逻辑,讨论修改,明晰文章思路和逻辑


多寻求外部帮助,找到毕竟senior的人帮你看几遍文章,找到你文章中的明显的行文和逻辑问题;


找不到senior的人看,也可以找同等水平甚至门外汉看,这里就是跟着他们读带他们理解你的意思,这个过程中,自己同步可以发现自己的逻辑漏洞;


实在没人看,那就是自己化身reviewr反复challenge自己。


总结,这一步的修改,是找到反馈,迭代修改几轮,让自己文章的主线和思路清晰起来

step2: 格式调整,语言润色


内容基础框架和思路确定之后,就是文章的美化了。


  • 首先是格式,严格按照所投会议或者期刊的要求调整好自己论文的格式;

  • 然后语言,这里推荐quillbot,开会员直接可以帮你改写到地道。

  • 最后是图表,图表多学习其他顶会文章的图表范式,美化好自己的图表,尤其是图,一图胜千言


扫码0.01元领取

180篇AI论文讲解课


以下是论文写作干货详细大纲


《180+条AI论文讲解课》

论文/课件/代码/数据集| 论文写作必备



CV篇


CV baseline —— Alexnet


1. 图像分割 —— FCN

2. 目标检测 —— YOLO V3

3. GAN —— 原生GAN

4. OCR —— CRNN

5. 轻量化网络 —— MobileNets

6. CV-transformer——VIT

7. 人脸识别——Eigenfaces

8. 三维重建 —— Alexnet



NLP篇


NLP baseline —— Word2Vec


1. 信息抽取(命名实体识别) —— LSTM

2. 信息抽取(关系抽取) —— CNN_for-re

3. 预训练模型 —— Transformer

4. 图神经网络 —— Nord2Vec

5. 文本匹配 —— DSSM

6. 机器翻译 —— Luong NMT

7. 情感分析 —— TextRNN

8. 阅读理解 —— MRC model

9. 对话系统 —— jointBERT

10. 强化学习 —— DQN

课程展示
课程展示

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
如何在4-6个月产出一篇论文?职场丨「我要准时收工」在香港到底有多难?国庆返京有多难?惨退4次票,朋友差点从湖南打车回北京...落实二十条有多难?该如何破局?疾控中心主任医师的观点从外地回北京,究竟有多难?C919适航取证有多难?距离商业载客运行还远吗?一文读懂想退电影票,有多难?现在的孩子要成为一个心理健康的人究竟有多难?钱学森出的考试题有多难?开卷都找不到答案...钱学森出的考试题有多难?开卷找不到答案,考试当场晕倒两人……一文盘点NeurIPS'22杰出论文亮点!英伟达AI大佬一句话总结每篇重点,一并看透今年技术趋势在抖音赚钱有多难?一夜翻转 治理“层层加码”有多难?今年秋招有多难?Top 1博士毕业,我的简历连大厂海选都没过......礼貌与礼帽只花2小时把包裹送给航天员有多难?丨科普一下一篇论文有8778位作者,人均只写5个字?加州伯克利、洛杉矶分校录取有多难?中国百所高中录取数据来啦!穷山恶水出刁民,绿水青山养文人(1)给娃起个名字有多难?我和家人轮番斗智斗勇2022年的港股有多难?钱多人少福利好,想润到北欧有多难?让塔克拉玛干通铁路,有多难?热议:发表一篇SCI有多难?打造一个真 3D 仿真世界,到底有多难?【庭院种菜】自家菜地,别用这种有机肥!全职妈妈招惹谁了?太难 ◇ ​温哥华年轻人找个对象有多难?答案令人心碎秋招开启形势惨烈,抢互联网公司的"一线城市门票"有多难?面对内卷与焦虑,成为一个心理健康的学生有多难?疫情放开有多难,改革开放就有多难20条后依然坚持“非必要不出境”,现在想移民有多难?李克强内部讲话(有待核实)视频丨租客竟然点火烧房!温哥华当个省心的房东有多难?英语有多难?王乙康直呼:我不会!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。