课程背景
数据一直都有,但我们从未像现在这样需要数据,渴望数据,因为大数据已经改变了我们思考和决策的方式,并正在创造未来。当下,几乎每个人和每个公司都需要具备数据分析的能力,只有这样,我们才能真正参与到这个海量数据崛起的时代。
但是,说到数据分析和数据挖掘,很多人都是心向往之,却总是望而却步:
- 要学的东西太多了,从统计学到 SQL,从 Python 到 R 语言,听着就累;
- 感觉太难了,数据挖掘算法根本学不明白,真叫人头大;
- 也学了不少东西,但觉得很理论,完全不知道该怎么用。
确实,数据挖掘和数据分析有一些门槛,但是和学习任何新东西一样,它也需要更加高效的方法。事实上,你只需要熟悉数据从采集、清洗到集成的准备过程,掌握最核心的十个数据挖掘算法,重视对工具的熟练使用,从一个个小项目做起,快速积累经验,你就能拥有数据分析这项新技能,有能力真正把数据转化成财富,创造价值。
为此,我们邀请了陈旸来为你讲解数据分析,帮你攻破它。
陈旸,清华大学计算机博士,前 IBM 中国研究院工程师。IEEE & ACM Member,中国人工智能协会成员,中国计算机协会 CCF 大数据专委。
在这个专栏里,他将结合自己的学习体会和实践经验,带你由浅入深掌握数据分析的核心知识点,并且结合案例手把手教你从源头上认识数据分析,熟悉对应的工具操作。同时,为了帮助你融会贯通,专栏还设计了专属题库,保证你能够即学即用。
学习收获
- 数据分析核心概念和工具;
- 数据采集、清洗、分析方法论;
- 10 大数据挖掘算法精讲;
- Kaggle 实战项目练习。
课程介绍
课程分为 5 大模块。
预习篇
介绍数据分析的全景图和最佳学习路径。此外还有 3 篇 Python 入门内容,分别是 Python 的基本语法和两大工具 NumPy、Pandas,帮助你快速上手。
基础篇
帮你梳理数据分析的流程,了解数据分析的方方面面。包括数据分析的基础概念、数据采集、数据处理以及数据可视化。
算法篇
算法是数据挖掘的精华所在,也是专栏的重点内容。专栏精选 10 大算法,包括分类、聚类和预测三大类型。每个算法都从原理和案例两个角度学习,帮助你快速理解和应用。
实战篇
理论是铠甲,落实在项目,进行实战才是我们的目标。专栏里精选了 5 个项目,让你在实操中深入理解数据分析,体验数据思维。
工作篇
面试通向数据分析工程师的最后一步,所以这一模块会告诉你面试时需要注意什么,职位的晋升路径又是怎样的?帮你打通最后一关。
课程大纲
预习篇
01 数据分析全景图及修炼指南
02 学习数据挖掘的最佳学习路径
03 Python的基础算法:开始你的python之旅
04 python科学计算:用numpy快速处理数据
05 python科学计算:pandas
基础篇
06 学习数据分析要掌握哪些基本概念?
07 用户画像:标签化就是数据的抽象能力
08 数据采集:如何自动化采集数据?
09 数据采集:如何用八爪鱼采集微博上的D&G评论?
10 python爬虫:如何自动化下载王祖贤海报?
11 数据清洗:数据科学家80%时间都花在了这里?
12 数据集成:这些大号一共20亿粉丝?
13 数据变换:大学成绩要求正太分布合理嘛?
14 数据可视化:掌握数据领域的万金油技能
15 一次学会python数据可视化的10种技能
16 基础篇热点问题答疑
算法篇
17 决策树(上):要不要去打篮球?
18 决策树(中):CART,一颗是回归树,另一颗是分类树
19 决策树(下):我们也来预测泰坦尼克乘客生存率
20 朴素贝叶斯(上):下意识判断要不要嫁给他?
21 朴素贝叶斯(下):如何对文档进行分类
22 SVM(上):如何用一根棍子将蓝红两色球分开?
23 SVM(下):如何进行乳腺癌检测?
24 KNN(上):如何根据打斗和接吻次数来划分电影类型?
25 KNN(上):如何对手写数字进行识别?
26 K-Means(上):如何给20支亚洲球队做聚类?
27 K-Means(上):如何使用K-Means对图像进行分割?
28 EM聚类(上):如何将一份菜分给2个人?
29 EM聚类(下):用EM算法对王者荣耀英雄进行划分
30 关联规则挖掘(上):如何用apriori发现用户购物规则?
31 关联规则挖掘(下):导演如何选择演员?
32 PageRank(上):搞懂google的PageRank算法
33 PageRank(下):分析希拉里邮件中的人物关系
34 AdaBoost(上):如何使用AdaBoost提升分类器性能?
35 AdaBoost(上):如何使用AdaBoost对房价进行预测?
实战篇
37 数据采集实战:如何自动化运营微博”加粉丝、写评论、发微博“?
38 数据可视化实战:如何给毛不易的歌曲做个词云展示?
39 数据挖掘实战(1):信用卡违约率分析
40 数据挖掘实战(2):如何针对一个视频网站搭建视频推荐算法?
41 数据挖掘实战(3):如何对比特币走势进行预测?
42 当我们谈深度学习的时候,我们都在谈什么?
43 如何用Keras搭建深度学习网络,做手写数字识别?
工作篇
44 如何培养你的数据分析思维?
45 求职简历中没有相关项目经理该怎么办?
请登录后发表评论
注册