转行|入门数据科学,这些技能必不可少

转行|入门数据科学,这些技能必不可少

丢掉气味的兔子
丢掉气味的兔子
7557 浏览

写在前面的话

哈喽各位dealmoon的小仙女们,我是兔子。三年前我还是一个纯纯的商科生,虽然高中学的是理科,但本科四年+研究生两年,全部读的都是会计!研究生毕业之后曾经短暂地在会计师事务所工作过一年。因为种种原因,我在2017年的夏天gap了一年,2018到2019年读了一年的Data Science program,终于在2019年末再次上岸,成为一名码农啦。

写这篇文章的目的,其实是想从一个转行过来人的角度,给大家分享一下在入学Data Science program之前我做了哪些准备,哪些材料/技术在我后来上学和工作的时候让我觉得获益匪浅。在数据这条路上我并没有走得很远,写码之路也才刚刚开始,希望我的小小经验可以帮助正在观望的盆友们。

图片来自网络

知识储备篇

Stats + Linear Algebra

图片来自网络

想要入门数据科学,那么统计和线性代数简直是必不可少的两门基础课程。统计的重要性不言而喻,不管是想走偏analytical的方向,还是machine learning,stats的地位都不可撼动。至于linear algebra,我记得在入学前曾经听学长说过一句话,“stats决定了你(data science生涯)的下限,而linear algebra决定了你的上限”。大家所知道的machine learning/deep learning,这些听起来就非常fancy的领域,其实linear algebra是最重要的基础。

下面推荐几本我读master时候我最最爱的老师使用的教材:

🌟Hogg, Robert V. and Elliot A. Tanis. Probability and Statistical Inference, 9th edition.

🌟Ghahramani, Saeed. Fundamentals of Probability, with Stochastic Processes, 3rd edition.

🌟Howard Anton and Chris Rorres. Elementary Linear Algebra, 11th edition.

A/B Testing

图片来自网络

也许是因为我实习期间做了一些跟A/B Testing相关的事情,又或许是因为我们A/B Testing的老师特别帅气(雾),我对这个领域其实很感兴趣。最简单的应用大概就是,大家刷ins的时候都会刷到投放的广告,假设现在ins每隔8个posts会投放一个广告,那如果我propose每隔5个posts投放广告,会对revenue产生怎样的影响呢?这就可以用到A/B Testing啦。

A/B Testing的基础就是统计,所以对这方面感兴趣的小伙伴一定要好好学习统计啦。我对A/B Testing的学习全部源自于我们program老师自己编写的教材,所以不方便share,但是曾经看到过大家诚恳推荐Udacity的A/B Testing课程。感兴趣的小伙伴可以去看一下。

Machine Learning

图片来自网络

Machine Learning的火爆程度,哪怕不是做tech的小伙伴,也应该都听得耳朵出茧子了吧。上面这张图应该是最经典的machine learning memes了哈哈。入门machine learning的第一步,大家可以先把statistics学起来了!当然如果之后想要进一步钻研deep learning,背后还有更庞大的数学知识需要掌握。

不过Twitter上流行这么一句话,“When you’re fundraising, it’s AI. When you’re hiring, it’s ML. When you’re implementing, it’s logistic regression.” 也正说明了,其实好多时候工业界的implementation和理论研究也相差很多。

图片来自网络

下面给大家推荐几个我自己入门machine learning的时候听过的课程。

 🌟 Andrew Ng在Coursera上的Machine Learning课程

这大概是想要学习Machine Learning的朋友都会想去看的一门课啦。课程内容比较深入浅出,讲解得也比较细致,只是课后练习我觉得并没有必要跟着做,因为所用的技术已经比较过时了。

🌟apachecn/AiLearning

喜欢看中文版的小伙伴可以去搜这个github,里面的内容涵盖了machine learning, deep learning, 甚至还有natural language processing,非常齐全了。

🌟Kaggle

Kaggle是一个成立于2010年的进行数据发掘和预测竞赛的在线平台。Machine Learning初学者去到Kaggle很容易迷失方向(至少我是这样),但是当你有一定了解之后,Kaggle就是个宝藏啦。先排除比赛名次什么的不说,光是很多有趣的dataset就能让我们有很多发挥的余地。对于很多已经结束的比赛,我们还是可以继续做,比赛排名靠前/大牛们都喜欢发一些自己的notebook或者code来分享自己整个modeling的过程,从中可以学习到很多,建议有兴趣的小伙伴一定要去看看。第一步从哪里开始呢?当然就是最著名的Titanic Machine Learning Competition啦!可以先跟着别人的notebook走一遍,再根据自己的想法添加features,选择model。不得不说有时候看着自己的model performance很好,真的很有成就感呢。

敬请期待工具篇+资源篇

好啦,这就是我今天想给大家分享的入门数据科学我觉得比较重要的一些知识,希望对大家有帮助。疫情期间如果有空余时间,大家可以好好利用这些时间,做些自己喜欢的事情,充实自己,生活才会更有意义呢 🥰大家如果有什么问题,欢迎留言给我,我们一起交流一起成长呀!

如果你对我从会计转行程序员的经历感兴趣,也欢迎戳下面的晒货,看看我转码六个月里学到的事情~👇

丢掉气味的兔子 10

宅家心得|正式转码六个月我学到的事情【1】

时间过得真得很快,从我决定商科转tech已经过了三年有余,这三年的心路历程大概可以写一百篇小作文,需要好好酝酿再写完这一百篇。但是这篇主要想跟大家分享一下我正式成为码农六个月之后的一些感悟,以及学到的东西,希望对正在观望转行/想要尝试新的领域的朋友们有一丢丢帮助。

🔸我的小收获#1
多沟通,多交流,不要害怕尝试新的机会

其实说起我正式成为码农的这六个月,也并不是顺风顺水。作为new grad被招进公司的我在分组的时候被分到了公司的西雅图office某个做full stack的组,这就意味着我要跟老公分居两地(他在湾区我在西雅图),而且有许多新的东西要学(我的前端经验几乎为零)。在几次跟recruiting team沟通relocation未果之后,我决定还是踏上这段新的旅程,也坚信一定会有新的收获。搬家到西雅图三个星期,每天除了正常上班和锻炼身体,一人独居的我多了很多思考的时间。我也开始仔细为自己规划起了目标,最先明确的事情就是full stack并不是我的兴趣所在,尽管组里的同事和老板我都很喜欢,但是拖久了再走也并不是好的选择,于是我开始了我的内部转组之旅。

接下来的一个星期我发了许多封email给公司内部其他组的老板,尽管大多数回复是“对不起我们已经找到人了”或者“我们想要招更加experienced的人”,但总还是有老板愿意跟我1:1,了解我的经历以及我的兴趣所在。我也竭尽所能在面试的时候向对方展示我过去取得的成绩,以及我最想要尝试的领域。我还记得在跟现在所在组的老板面试的时候,作为同样在IT行业工作的亚裔女性,她跟我分享了很多她的工作经历,并且鼓励了我reach out for better opportunities的行为。幸运的是,很快我现在所在的组里有了新的名额,组里的老板也愿意给我这个新手小白一个尝试的机会,才让我非常顺利的在入职三个月内完成了公司内部转组,并且回到了湾区的office。

这之间的另外一个小插曲就是,当我原组的老板知道了我刚刚入职就想转组的时候,非常的愤怒。我真的完全理解他的愤怒,也为自己的选择对他感到歉意。这时候我即将入职新组的老板message了我,告诉我她和我的原组老板聊过了,也理解了他的concerns,鼓励我好好和原组老板解释自己想要转组的原因。于是在接下来我和原组老板的1:1中,我向他说明了原委,也取得了他的原谅。入职前三个月的故事就此告一段落,我也意识到了沟通真的是一门艺术。

🔸 我的小收获#2
提问之前先做好功课

新组入职,我很幸运有一位跟我同龄的小姐姐做我的onboarding buddy,她在tech行业已经工作四年有余,不管是做事还是做人都是我学习的榜样。其中一件事情她告诉我的就是,不要害怕问别人问题,但是在提问之前,先做好功课。

我现在所在的组比较新,很多东西没有一个well established的knowledge sharing system,人员流动也比较快,就导致了很多东西都只能靠四处询问来获得答案。我是个有点要强又死要面子的人,于是有疑问之前就会尝试先自己寻找答案。寻找答案的过程中我也渐渐发现,有很多东西都已经有了documentation,只不过散落在各个地方,没有一个整合好的资源,于是下一次我再向组里同事发问的时候,我的问问题模式就从“请问要怎么解决X”,变成了“我想要解决X这个问题,经过调查,我发现A,B,C都可以作为解决方案,经过分析我觉得A更佳有效,你怎么觉得?”。这样的提问方式也帮助我更有效地和同事沟通,更快地找到问题所在。

丢掉气味的兔子 10

宅家心得|正式转码六个月我学到的事情【2】

接着上一篇,写写入职六个月以来我学到了些什么。

🌟 我的小收获#3 - 对自己有信心
作为一个转专业小白,再加上我之前读的master其实是跟data science相关的,CS方面的基础知识我几乎为零了,这也导致我在刚进组的时候非常不自信,meeting上有了自己的见解也不敢发言。

印象最深刻的一件事情是,我们每两周会有一次整个大组的demo,大家会在demo meeting上展示自己的一些成果。我恰好被选作我在的project的展示者之一,给组里人介绍我做的model evaluation。虽然整个presentation还算顺利,但是因为有点不自信,经常会习惯性地cue到project里带我的同事。第二天同事特意跟我聊了十分钟,给我feedback,希望我下次在展示自己的成果的时候有些信心,be proud and confident of what you did。

随着收集大家的feedback,以及对组里tech stack渐渐熟悉起来,我开始敢在组会上发表自己的看法,有时候提出的想法还能得到组里大佬的认可,小白真的非常开心了。

在找回自信心的路上我还有很多挑战要克服,但是我也学到了,全力以赴去完成每个task,在向别人沟通或展示成果的时候也要有底气,毕竟每一行码都是我自己写的,我有什么好不自信的呢?

我觉得很多像我一样正在转专业/转行的路上的奋斗的姑娘可能都会有这样的moments,不要害怕,也不要因此自卑。我们既然勇敢地作出转变的选择,就已经是迈过了最难的一步,人生这么长,哪有什么困难是解决不了的呢😉

 

君君提示:你也可以发布优质内容,点此查看详情 >>

本文著作权归作者本人和北美省钱快报共同所有,未经许可不得转载。长文章仅代表作者看法,如有更多内容分享或是对文中观点有不同见解,省钱快报欢迎您的投稿。

7557 62 16

扫码下载APP