Redian新闻
>
普通人CV领域论文创新常见思路与方向总结

普通人CV领域论文创新常见思路与方向总结

公众号新闻


MLNLP社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。
社区的愿景是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进步,特别是初学者同学们的进步。
转载自 | 极市平台
作者 | 何杰文@知乎
来源 | https://zhuanlan.zhihu.com/p/423273070

1

『做CV的论文创新的一些思路与方向』

1.无事生非

  1. 在原始的数据集上加一些噪声,例如随机遮挡,或者调整饱和度亮度什么的,主要是根据具体的任务来增加噪声或扰动,不可乱来。如果它的精度下降的厉害,那你的思路就来了,如何在有遮挡或有噪声或其他什么情况下,保证模型的精度。
  2. 用它的模型去尝试一个新场景的数据集,因为它原来的模型很可能是过拟合的。如果在新场景下精度下降的厉害,思路又有了,如何提升模型的泛化能力,实现在新场景下的高精度。

2.后浪推前浪

  1. 思考一下它存在的问题,例如模型太大,推理速度太慢,训练时间太长,收敛速度慢等。一般来说这存在一个问题,其他问题也是连带着的。如果存在以上的问题,你就可以思考如何去提高推理速度,或者在尽可能不降低精度的情况下,大幅度减少参数量或者计算量,或者加快收敛速度。
  2. 考虑一下模型是否太复杂,例如:人工设计的地方太多,后处理太多,需要调参的地方太多。基于这些情况,你可以考虑如何设计一个end-to-end模型,在设计过程中,肯定会出现训练效果不好的情况,这时候需要自己去设计一些新的处理方法,这个方法就是你的创新。

3.推陈出新

替换一些新的结构,引入一些其它方向的技术,例如transformer,特征金字塔技术等。这方面主要是要多关注一些相关技术,前沿技术,各个方向的内容建议多关注一些。

4. 出奇制胜

尝试去做一些特定的检测或者识别。通用的模型往往为了保证泛化能力,检测识别多个类,而导致每个类的识别精度都不会很高。因此你可以考虑只去检测或识别某一个特定的类。以行为识别为例,一些通用的模型可以识别几十个动作,**但你可以专门做跌倒检测。在这种情况下你可以加很多先验知识在模型中,例如多任务学习。换句话来说,你的模型就是专门针对跌倒设计的,因此往往精度可以更高。**这种特定类的检测最好是有些应用前途,让人觉得现实中可以有。


2

『创新思路形成的学习方法总结』

以上都是一些针对性的思路,最原始的做法应该是看完方向上比较重要的论文后自己写一个综述,写的过程中往往会发现一些问题,不一定就是要去跟sota模型比精度,而是解决这个方向上还存在的问题。解决还存在的问题才是关键,才是论文的核心价值所在,否则就只是十几页的废纸。

例如前面提到的实现轻量化,提高推理速度,实现实时检测,设计end to end模型,都属于解决这个方向上存在的问题,进一步提高精度也是解决问题,此外还包括一些其他的问题,这个得根据具体任务才能分析。

如果说写完综述后还是没思路,一来是建议尝试以上思路,二来建议找一些跟你方向相关的经典论文看一看,边看边想,这四个字最重要。当然,边看边想要想发挥作用,还需要有个最重要的前提,知识面足够广,否则再怎么想也没用

很多情况下在模型上加入一些别的方向的模块,例如使用即插即用的模块、注意力机制等,可以使模型有一定的提升,这是算创新的。但需要一个合理的解释为何这么做可以起作用,解决了什么问题。有时候对原模型做一些小的改进,却有较大的提升,这也属于创新。前提是,这种提升是稳定的,是在多个数据集下都有的提升,而不是一次偶然事件


技术交流群邀请函

△长按添加小助手

扫描二维码添加小助手微信

请备注:姓名-学校/公司-研究方向
(如:小张-哈工大-对话系统)
即可申请加入自然语言处理/Pytorch等技术交流群

关于我们

MLNLP 社区是由国内外机器学习与自然语言处理学者联合构建的民间学术社区,目前已经发展为国内外知名的机器学习与自然语言处理社区,旨在促进机器学习,自然语言处理学术界、产业界和广大爱好者之间的进步。
社区可以为相关从业者的深造、就业及研究等方面提供开放交流平台。欢迎大家关注和加入我们。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
爸爸,我不用读书了(小小说)未来26年,广州往哪个方向发展?广州城市发展战略有哪些新思路?铜死亡研究2022丨研究论文大爆发,这15篇论文及大数据分析帮你理清研究思路超详超硬Jeff Dean万字总结火热出炉!图解谷歌2022年AIGC、LLM、CV三大领域成就博士生申请 | KAUST IVUL招收DL/GraphML/CV方向优秀硕/博/访问学生/博后/研究科学家我向总理说句话,留言直达国务院远程实习 | 美国德州大学达拉斯分校招收ML/NLP/CV等方向暑期科研实习生科技赋能、创新赋能、圈层赋能,搭建全球科技创新·创业·创投服务生态圈 | 硅谷高创会2022年度总结Woolies重磅活动!孩子们免费玩儿,大人们免费吃,参与方法公布(多图)赵建:读懂中国式现代化——道路与选择最强聊天机器人ChatGPT爆火,从代写论文进化到抢我饭碗CV发论文的机会来了!南洋理工项目招生(仅限深度学习,AI,机器学习,迁移学习方向)自诩“RISC-V领导者”,高通要与ARM一拍两散?限流、熔断、高可用的思路与方法!专访科沃斯机器人CEO钱程:全场景、多机协同是机器人未来的发展方向博士申请 | 美国密歇根州立大学ACTION Lab招收CV/ML方向全奖博士生创业、裸辞、失落、美好……10个普通人的2022年终总结|甲子光年《2022创新药白皮书》:30张图表概览10余细分领域的前沿布局与差异化创新《山居续忆》:第十七章:回忆就我所知的上海古典音乐市场 兼谈我的听乐经历 (下)可翻领、可V领、可高领,这件半拉链毛衣简直太好穿了!包容显瘦,时尚慵懒,轻松hold住各种风格!全额奖学金,爱丁堡大学李昌健课题组CG/CV/医学影像处理方向博士/博士后/研究助理/访问学生招募慢镜头下的神奇A+B+C写作公式?顶会论文创新点干货!PD-L1/PD-1研究2022丨诺奖加持,论文和基金均火箭速度增长;成果及转化正在其时!大数据分析及19篇论文帮你理清思路在线学术交流丨通过解读MG经典论文,讨论疾病管理、疾病负担、及传统治疗/新兴靶向治疗进展,启迪临床科研思路2023考研不延期! “普通考研人”冲击名校新思路!2023考研不延期!考研留学双保险机制, “普通考研人”冲击名校的新思路!文创推荐 | 筹备了多年,《上新了故宫》再出非遗精品,还有超超超值的文创赠品!博士申请 | ​英国爱丁堡大学李昌健老师招收CG/CV方向全奖博士/博后/RAPI3K/Akt靶向研发异常活跃丨最近2年70%SCI论文由国人发表;这4项在研基金及11篇论文给你创新性思路!陪伴北京近七十年的它,要关门了,那里也曾留下过我青春时的脚步Jeff Dean万字总结出炉!图解谷歌2022年AIGC、LLM、CV三大领域成就!七彩文鸟,又称七彩神鸟2023年,比较好发论文的CV方向第三季度CVC参投14家独角兽企业;赣锋锂业以9.62亿美元收购阿根廷锂矿资源|中国企业创投(CVC)季报
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。