8步成为数据科学家 Hadoop 第1张

8步成为数据科学家 Hadoop 第2张

SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。

8步成为数据科学家 Hadoop 第3张

 

文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。

 

 

 

转自 |  猴子聊人物(公众号ID:houziliaorenwu)

作者 |  猴子

 

8步成为数据科学家 Hadoop 第4张

8步成为数据科学家 Hadoop 第5张

 

这是国外数据科学学习平台DataCamp成员写的一篇图文《8步成为数据科学家》。我们具体来看下有哪些学习内容和学习资源。

这里说的8步,不是你用8周就可以完成,而是一种学习的方法。这些步骤虽然没有那么简单,但是都是可操作,可实践的。只要你投入时间去学习,相信时间的积累力量,就可以掌握这些知识。

 

首先,什么是大数据科学家? 

 

数据科学家是一个跨学科人才,是比软件工程师更擅长统计学,比统计学家更擅长软件工程的人。需要掌握的知识有数学统计,编程能力,机器学习,研究能力等。

 

8步成为数据科学家 Hadoop 第6张

 

目前,数据科学家大部分是本科或者硕士学历(本科37%,硕士31%)。但是不要担心,从调查数据来看,有5%高中毕业的人也成为了数据科学家。这足以证明,只要你努力去提供自己,英雄是不问出处的。

 

8步成为数据科学家 Hadoop 第7张

 

01第1步:学好统计、数学和机器学习

 

下面给出了学习这些知识的资源。如果感觉这些资源学起来太难,可以从《赤裸裸的统计学》、《深入浅出统计学》这两本书入门。

 

8步成为数据科学家 Hadoop 第8张

 

02第2步:学会编程

 

掌握计算机科学的基础知识,学会系统开发的整个过程(end-to-end development),因为你做的东西会成为其他系统的一部分。

 

选择一种数据分析的编程语言,例如开源软件的R , Python语言等,或者商业软件的SAS, SPSS等。

 

在学习过程中可以用DataCamp, tryR, Codecademy或Google Class进行交互式学习。

 

8步成为数据科学家 Hadoop 第9张

 

03第3步:理解数据库

 

在大部分的实际数据分析项目中,数据大部分是存储在数据库中的,所以你得学会数据库的操作,如关系数据库MySQL,非关系型数据库MongoDB等。

 

8步成为数据科学家 Hadoop 第10张

 

04第4步:学会数据预处理、可视化和报表制作

 

1. 数据预处理:在数据分析师的工作中,有多达60%的时间都花在了实际分析前数据的准备上。数据预处理的目标是为了把数据改变成我们喜欢的样子,以便于后期的分析处理。这就好比,现在很多女孩照相喜欢用美图秀秀,眼睛不大,那我就用美图秀秀把眼睛变大。变成自己喜欢的样子。

 

8步成为数据科学家 Hadoop 第11张

 

数据预处理可自学Coursera中《Getting and Cleaning Data》的 课程(作者:John Hopkins)。也可以用工具DataWrangler、R语言的data.table和dply包。

 

2. 数据可视化:数据可视化是将数据分析的结果显示出来,便于展示。实用工具有ggvis, D3, vega。

 

3. 数据报表:作为数据分析的最后一步,是将数据分析和结果制作成易于理解的报告。实用工具有Tableau, Spotfire和R Markdown。

 

8步成为数据科学家 Hadoop 第12张

 

05第5步:提升到大数据级别

 

当你开始处理海量规模的数据时,绝大多数的数据科学家要解决的问题,都无法在单机上完成,需要用分布式处理大数据集,使用的工具有Hadoop,Apache Spark。

 

8步成为数据科学家 Hadoop 第13张

 

06第6步:多实践,与数据科学家大牛多交流

 

幸好是互联网时代,我们可以通过网络认识大牛,并从他们分享的知识内容中学到更多经验知识。当然,你也可以通过参加比赛,做小项目获得更多的实践经验。

 

8步成为数据科学家 Hadoop 第14张

 

07第7步:实习、实战、或找份工作

 

判别自己是不是一个真正的数据科学家的最佳途径,就是用你新学的知识迎难而上,进入数据分析的工作领域。

 

8步成为数据科学家 Hadoop 第15张

 

08第8步:通过专业社区学到更多

 

数据分析的网站有:DataTau, Kdnuggets, fivethirtyeight, datascience101, r-bloggers。

 

可以看这些数据科学大牛的博客:Hilary Mason, David Smith, Nate Silver, dj patil。

 

可以从quandl上获取数据。

 

8步成为数据科学家 Hadoop 第16张

 

以上就是成为数据科学家的8步,你在哪一步呢?

 

8步成为数据科学家 Hadoop 第17张

8步成为数据科学家 Hadoop 第18张

扫码关注我们
微信号:SRE实战
拒绝背锅 运筹帷幄