Redian新闻
>
双非一本跨申热门数据分析,我成功发表国际一作论文,完成自我蜕变!

双非一本跨申热门数据分析,我成功发表国际一作论文,完成自我蜕变!

公众号新闻

※ 本文系指南者留学学员原创,转载请联系授权


学员背景

C同学

双非一本 金融学

打算申请人资管理,商业分析,数据分析方向海外研究生

参与项目

指南者商业分析科研论文指导


选择背提的目的

大二的时候,我签约了指南者留学。由于准备时间较为充足,申请主导师就向我推荐了背景提升项目,以提升自身的软实力背景。

我的专业是金融学,但是我要申请的方向是人资管理/商业分析/数据分析,这些专业对编程语言和数据分析的经历都有一定的要求,比如需要掌握Python,R,SPSS等,跨专业申请还要求有相关的项目经验。而学校对商科所开设的数据分析课程都是很简单的课程,对实际工作没有太大帮助,所以一开始,我选择指南者留学的背景提升项目就是想提高Python数据分析的能力。

我在接触这个项目之前没有学过Python,就连Excel也不太会,英语能力也不是很强,所以很担心会完不成这个科研。甚至在学习过程中,有时也会对自己产生质疑,但做完了之后,我才发现科研其实并没有想象中那么难,而且还收获了很多知识。


项目具体学习

理论培训部分

首先,我对Python知识进行了初步学习,包括Python基础,NumPy库,pandas库,matplotlib库(数据可视化),数据清理和数据处理,特征工程(特征筛选,特征处理等),聚类,降维,还有回归模型,分类模型和stacking算法等机器学习和集成学习领域的知识。我之前从来没有接触过Python,一开始学的时候学得很投入,大约花了一周就学完了所有内容。

指南者老师录的课讲得非常清楚,脉络也很清晰。相较于网上几百集的python课程,我更偏好于指南者的课程:教给学生最核心的内容,然后再慢慢拓展,而且每节课课后都会有作业可以帮助理解内容和大致框架,做完作业之后也会有老师认真地给我批改和讲解,即使有不懂的点,在讲解过后也变得易懂了。此外,课程中基本没有刻意地去背知识或者记代码的部分。感觉最重要的还是“重复应用”和“练习”,反复训练就能够初步了解并熟悉框架

在理论学习过程中,我的进展也比较顺利,所以很快就进行到了项目的实战阶段。

选题方向

我要申请的方向和人资管理还有数据分析都有关系,因此教授提出了一个叫做“基于面试者建立的薪资预测模型”的课题,和我要申请的方向非常符合。而且,李教授本身也是南洋理工大学商学院的教授,管理科学杂志审稿人,对此十分有经验。最终我们确定以此作为选题。

科研过程

在确定选题之后,李教授给我发了一个薪资数据集,逐步教我如何开始研究。每周末我都会和李教授、梅老师进行线上会议汇报工作,教授会给我一些指导,以及布置下一周的任务和方向。

平时,教授和梅老师会很耐心地回答我提出的问题,且不会直接给我答案,而是引导性地提出一些问题和思考,让我自己先去尝试和思考还有查询相关内容。

比如在学习如何把分类变量转化为虚拟变量时,老师们会让我自己先去查询和研究。还有在特征筛选的时候使用点二列相关算法,随机森林特征重要性等,老师不会直接告诉我结果,除非在我研究过后还是不懂,才会给我示范一遍,这使得我在做项目的过程中能够不断磨和提升自己的能力。

在科研过程中,我尝试用各种回归算法建立薪资预测模型,最后还用了stacking算法集成模型,将多个第一层回归模型的预测结果作为第二层模型(元模型)的输入值进行再次拟合,然后得到最后的回归预测结果,减小过拟合的风险。经过多次建模之后,我发现自己已经能显著地减少预测误差,建立出一个薪资预测模型。

李教授在授课中提到,我不仅需要关注最后的预测结果,还要增强数据叙事的能力。于是我用OLS线性回归得到了各个变量和薪资之间的相关系数以及p值,还有其他的一些数据,接着还进行了一些数据可视化展示,通过可视化进行分析。

论文写作与发表

完成科研实验之后,老师让我阅读了几篇英语论文,并给了我大概的论文写作框架以及侧重点。

我一开始挺害怕写全英论文的,但其实论文写作是整个科研过程中最简单的部分。本着循序渐进的想法,我首先完成了论文中介绍研究背景、数据集和理论基础的部分,然后写清楚研究的过程,包括数据清洗和数据预处理,特征工程,建模过程还有调参过程等等,最后列出对照组和实验组的结果,并总结出相关结论。

论文初稿完成后,老师会提出内容的修改意见,进行一些排版问题(如图表)的调整等。接下来老师会去选择相关的国际会议,并准备将论文投稿到国际会议上。

最后,我的论文被CPCI会议录用,并在会议上进行了英文汇报演讲。


自我提升与收获

完成背景提升项目后,我不仅收获到了教授的推荐信,还有独立一作+通讯的CPCI会议论文,也能够去进行数据清洗,预处理和可视化,很熟练地建立回归和分类模型解决实际问题等等。这意味着我已经可以比较熟练地进行数据分析了。

如果大家想要留学,建议在个人软背景方面提前做好准备,这样就可以在更充分的时间内提升自我。而且,接触科研对我们后期的科研打好基础很有帮助。我在那段时间学到的知识,在之后的学业过程、竞赛和实习中都可以应用到,也让我能更快地学习和理解新的Python知识之后,我还自己发了两篇EI会议,并获得了安永数据科学挑战赛的全球前十,其中也用到了stacking算法

到现在,我已经完成了从零到一的自我蜕变,从科研小白变得能够参加比赛、自己发表实习等等。这段经历教会了我一点:科研是件循序渐进的、持续提升的事。它既需要合适的领路人,也需要自身的努力和不断的试错。希望大家都能够达成理想中的目标,变成更好的自己!


扫描下方二维码

咨询报名科研项目



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
港中文教授:基于深度学习的RNA测序方法研究|收获一作论文与导师推荐信!有志者事竟成:我做科研发表国际一作论文,助力“EE+人工智能”相关专业申请!双非一本,均分84,托福96,GRE332,可以申请到美国什么大学?中国人要打中国人曼大教授——化学人工智能科研|收获一作论文与导师推荐信!一句话搞定数据分析,浙大全新大模型数据助手,连搜集都省了芝加哥大学贺教授:疾病类遗传突变的生物信息学分析|收获一作论文与导师推荐信!2023回国 申请手机号,银行账户,吃生煎(多图)港中文李教授:基于遥感图像的地理空间图像分类识别|收获一作论文与导师推荐信!港中深郭教授:大学生同性恋爱中的社会支持与认同|收获一作论文与导师推荐信!港中文李教授:基于AI的网络数据包攻击风险预测|收获一作论文与导师推荐信!新加坡管理大学刘教授:基于机器学习的量化交易策略|收获一作论文与导师推荐信!应统问答室 | 数据分析这个岗位现在前景是不是不怎么好?来自十年数据分析师的建议好机会!“文献计量分析及论文发表”培训,本次由发表了20多篇SCI的大咖引领,以高质量SCI论文为目标【附PDF】整理了114篇医疗论文,含cvpr2023医疗论文+经典论文+医疗论文综述等港中文李教授:基于深度学习的语音识别算法研究|收获一作论文与导师推荐信!仅限10人!“文献计量分析及论文发表”培训,本次由发表了20多篇SCI的大咖引领,以高质量SCI论文为目标发表了20多篇SCI的大咖引领,以SCI论文为目标;“文献计量分析及论文发表”培训,仅剩3个名额!南安普顿龚教授:咖啡行业可持续供应链管理实践|收获一作论文与导师推荐信!港大张老师:基于机器学习的量化交易方法研究|收获一作论文与导师推荐信!港中文李教授:人工智能垃圾分类算法研究|收获一作论文与导师推荐信!上市公司财务状况对环境、社会和公司治理 (ESG)影响研究|收获一作论文与导师推荐信!双非,考研失败,我跟随南洋理工教授发表国际一作论文助力留学申请!港理工袁教授:电动汽车先进扭矩控制器设计|收获一作论文与导师推荐信!妻妾成群,不只在苏童笔下。。。。NTU教授——商品打折活动对消费行为影响的研究|收获一作论文与导师推荐信!《祖国万岁》&《花轿里的人》数据分析和你数据分析专业能力并无半毛钱关系南洋理工教授:学生成绩预测与影响因素分析|收获一作论文与导师推荐信!顶尖实验室王教授:多模态医疗影像数据的配准技术|收获一作论文与导师推荐信!2024川普还是拜登?NTU李教授:新闻联播的内容对房价影响的分析|收获一作论文与导师推荐信!曼大孙教授:ChatGPT在MineCraft游戏中的智能体设计|收获一作论文与导师推荐信!【最后一个名额】发表了20多篇SCI的大咖引领,以SCI论文为目标,“文献计量分析及论文发表”培训本周六开始!从传统经济学跨申数据科学,我发表国际一作论文助力留学申请!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。