该课程由猎学网审核,享受猎学网报名、支付保障
【课程简介】
学习方式:
直播/录播视频学习+在线答疑+每周作业+沙盘演练+毕业考试
共8周课程56课时,每周至少一次直播
直播后提供录制回放视频,在线反复观看,有效期1年
内容介绍:
本课程面向于大学应届毕业生,和希望转型数据科学的攻城狮,程序猿们,学完本课程,您将对整个数据科学的概念和方法有个充分的掌握,也有了足够的技术积累能让您踏入数据科学这个充满魅力的行业。本课程也会指导您怎样准备和参加数据科学的面试,学完本课程,您可以轻轻松松的找到一份知名公司数据科学相关的工作。后续还将会有配套的中级和高级课程。
课程大纲:
第1章:数据科学概念
第1节:身边的数据科学
第2节:数据科学的定义
第3节:本课程的特点
第4节:相关的专题
第2章:关系数据库和关系代数
第1节:数据处理原理
第2节:关系代数
第3节:数据科学中的SQL
第4节:关系数据库的基本原理
第3章:MapReduce
第1节:海量数据的思考
第2节:MapReduce编程模型
第3节:MapReduce中的算法
第4章:NoSQL
第1节:NoSQL解决的问题种类
第2节:Key-Value关键概念
第3节:NoSQL的存储结构
第4节:扩展的NoSQL系统
第5节:Pig简介
第6节:用Pig做分析
第7节:Spark
第5章:图分析
第1节:结构化任务
第2节:遍历型任务
第3节:模式匹配任务和图查询
第4节:递归查询
第5节:图上的表示和算法
第6章:实用统计推断
第1节:统计推断介绍
第2节:采样方法
第3节:实际遇到的问题
第4节:多重假设检验
第5节:贝叶斯方法介绍
第7章:监督学习
第1节:基于规则的学习
第2节:基于树的学习
第3节:模型评估
第4节:增强学习
第5节:K-近邻方法
第8章:化方法
第1节:梯度下降法
第2节:构造损失函数
第3节:算法的考虑
第9章:非监督学习
第1节:聚类
第2节:PCA
第3节:SVD
第10章:文本挖掘
第1节:TF-IDF
第2节:文本生成模型
第3节:主题模型(PLSA,LDA)
第11章:社交网络挖掘
第1节:社交网络的表示
第2节:PageRank
第3节:社交网络分群
第12章:深度学习入门
主讲人:余戈华为数据科学家理学硕士
华为数据挖掘团队Leader,每天10TB+的数据挖掘分析工作。熟知当今用途最广泛的数据挖掘、机器学习和数理统计方法,精通各种数据挖掘平台工具和数理统计包(R,python、Spark等)。
顾问将于24小时内联系您!