零基础转行DA系列|一周Python for Data Science入门

零基础转行DA系列|一周Python for Data Science入门

你个死兔子
你个死兔子
2.74万 浏览

那些和兔子一样在DA转行路上的小伙伴们,大家好~

一周前写了一篇两周学完SQL的文章,得到出乎意料的反馈,竟然有这么人跟我一样在转DA或者DS😆。给了我更大的动力继续更新我的学习进度。这是我上一周的学习成果:Python for Data Science。是的,一周就可以学完。上一篇评论里面有宝宝说SQL两天就可以学完,这个说法完全可信。什么东西都是入门比较困难,入了门学习会越来越快的。因为入门学习除了陌生的知识,还要克服很多心理上的障碍,很容易放弃。所以你要是第一门课完整地坚持学完,第二门、第三门会越来越容易。我自己也是这种感觉,Python按说比SQL要难一些,但是比起SQL的两周,Python我一周就学完了。

2baf8db084eac764d4d2e6d.jpg

SQL复习

希望看我这篇文章的宝宝已经完成了SQL的学习。所以我在这里提醒一下,学Python的时候千万不要忘记SQL的复习,因为学懂是学懂了,但是这些东西最重要的还是熟练,如果你忘记了,跟不会是一样的(不是指单个的语法,语法忘记可以查)。因为Leetcode上面的题easy的我很快就刷完了,又不想花太多的时间钻研medium和hard的,因为想留足够多的时间给Python学习,所以我又返回去练习Stanford那个DB5 SQL课程的练习题。把之前的答案全部删掉重新写,这次我采用边讲边写的方式,模拟面试时候的情景,用英语跟面试官clarify,然后一步一步写出问题的答案。

696914424e962f456edcef9.jpg
sql复习

Python for Data Science学习

我用的Udemy上面Kirill Eremenko的Pyhton for Data Science,这门课简直没有任何挑剔的,除了讲作业的小哥的口音让人哭笑不得之外。Kirill Eremenko的发音非常清楚,讲课非常专业,能站在一个初学者的角度给人讲问题,知道我们可能哪些地方有疑惑。强烈推荐这门课,学完大部分的visualization(把数据生成图表)都可以做了。基本上学完这门课,你就可以进入实际的练手+自我学习阶段了。课程总共73个lectures,但其实好几个lectures是讲作业的,还有些bonus lectures。vedio 总共11个小时。如果能每天抽出两个小时,一星期就可以学完了。

914677bb0feaa8170ab1a9c.jpg

有关这个课程的一些叨叨

先看两个我上课完成的图表,激励一下自己😆。我自己觉得超级酷。

4e2ee09eaebb88afc769959.jpg
0d3b03557323538072b77a0.jpg

看评论中有的同学平时没有很多资源帮助自己解决学习过程中遇到的问题,所以我在这里把这门课中我遇到的问题和解决办法提供给大家,希望能减少你自学路上的羁绊。

这门课刚开始需要安装Anaconda,然后之后的课程全是在里面的Jupyter Notebook中完成。我觉得安装东西对于我这种外行来说,尤其害怕,总觉得非常复杂。但是其实你知道照着说明,一步一步来就可以了。以后多装几次就熟练了。在Jupyter Notebook中写东西刚开始会不习惯,因为每次输入code之后,不论有没有return结果出来,都需要enter+shift输入,我刚开始总是忘记,经常以为自己写错了,但是最后发现只是没有输入而已。

a85d66bfc661eb8ed41b4b9.jpg

一定要动手写,老师教一个用法,就暂停视频,去自己的notebook里面也实现一下,不然光盯着屏幕一会就觉得云里雾里了,要不就是以为看懂了,自己一动手就错误百出。

第一个作业就是证明正态分布,很有意思。第二个作业就开始用学的知识处理实际问题了。用学的list、function之类的处理一个财年的金融报表。第五个作业中,刚开始要给Python中导入表格,然后跟着老师的做法一直出错。后来发现是自己弄错了😂,首先要去superdata中将表格下载在自己的电脑上,这个老师没有说,可能以为太简单了,人人都知道,没想到我那么傻😂。下载之后在pd.read_csv()中填写自己的文档full path,不要写老师的,那是老师自己的文档地址(这个问题现在看起来非常简单,但是当时就是一头雾水)。还有一个问题是如果老师提供的文档后缀是ipynb,要去Jupyter Notebook的file中打开,不然格式不对。我作业过程中很多问题都来自如果安装、导入文档之类的,我刚开始觉得这些好复杂。

作业如果没有头绪,就跟着老师提供的Homework Fill in the Blanks,把需要的东西填进去,这样难度会小一些,也比较条理。

课程中会学习很多有用的package,封面图里面的大部分都会学到,这些package非常的powerful。

802db621ddb8a090e8efdf7.jpg

看到自己第一次用数据生成表格,超级激动,希望你也有同样的感觉。

793863a8c04374153730e47.jpg

Python或者任何计算机语言,老师都不可能把所有的语法都教给你,因为实在太多了,而且没必要。入门了之后很多东西需要的时候自己去查就可以了。一个很重要的习惯就是学会查询,问问题,查看error信息,然后解决问题。这样你就已经掌握了这门语言。

55337b08762f8dc866f3a5f.jpg
71cfaad00f3144c11c3f127.jpg

下面一两个星期,我准备开始做Python的项目了,课程是Coursera上面的,学完再来跟大家分享。项目做完之后,再正式开始R的学习。希望你也有一个紧凑有效的学习计划~ 我们下次再见

君君提示:你也可以发布优质内容,点此查看详情 >>

本文著作权归作者本人和北美省钱快报共同所有,未经许可不得转载。长文章仅代表作者看法,如有更多内容分享或是对文中观点有不同见解,省钱快报欢迎您的投稿。

27444 813 293

扫码下载APP