|
本课程系统地讲述了大数据时代背景下的大数据生态体系,从分布式协调开始,逐步深入到分布式,流处理等计算引擎,通过系统的剖析当前典型的企业级大数据平台架构设计,为学员带来最真实的案例分析,从而培养学员对大数据技术的洞察力。在完成课程后, 能够面试大数据岗位、熟悉大数据岗位在公司的开发流程和职位发展,对大数据架构有清晰认识,并能落地课程所教实战解决方案。 【No.01】开学典礼+常见业务架构 【No.02】整体结构+MapReduce+pyweb 【No.03】文本相似度 【No.04】中文分词 【No.05】中文分词 【No.06】推荐算法 【No.07】分类算法-NB 【No.08】分类算法-逻辑回归 【No.09】分类算法-多分类 【No.10】推荐系统demo 【No.11】推荐系统+简历面试 【No.12】Yarn+HDFS 【No.13、14】Yarn+Spark 【No.15】Spark实践 【No.16】Hive 【No.17】Hive 【No.18、19】Hbase 【No.20】Flume 【No.21】Kafka 【No.22、23】Storm+zookeeper 【No.24】Spark Streaming 【No.25】Spark SQL 【No.26、27】LogServer 【No.28】Kmeans 【No.29、30】深度学习 【No.31】决策树+模型融合 资料
|
|