课程介绍

课程来自于 马士兵-Python大数据全栈工程师(视频+课件)

马士兵教育创立于2016年,致力于JAVA、架构师、Python、人工智能、AIOT、网络安全、算法与数据结构等IT技术培训,提倡“复杂问题简单说”!

马士兵-Python大数据全栈工程师(视频+课件)插图

文件目录

001.hadoop-大数据启蒙-初识HDFS.mp4

大数据一课课件.zip

002.hadoop-HDFS理论基础读写流程.mp4

003.hadoop-HDFS集群搭建-伪分布式模式 1.mp4

003.hadoop-HDFS集群搭建-伪分布式模式 2.mp4

004.hadoop-HDFS集群搭建-HA模式概念 2.mp4

004.hadoop-HDFS集群搭建-HA模式概念 1.mp4

005.hadoop-HDFS集群搭建-HA模式验证.mp4

006.hadoop-HDFS权限、企业级搭建、idea+maven开发HDFS 1.mp4

006.hadoop-HDFS权限、企业级搭建、idea+maven开发HDFS 2.mp4

007.hadoop-MapReduce原理精讲、轻松入门.mp4

008.hadoop-Mapkeducen度原理,Varn原埋 1.mp4

008.hadoop-Mapkeducen度原理,Varn原埋 2.mp4

009.hadoop-MapReduce-Yar集群搭建、idea开发MR的wC程序 2.mp4

009.hadoop-MapReduce-Yar集群搭建、idea开发MR的wC程序 1.mp4

010.hadoop-MapReduce作业提交方式、源码-客户端提交源码 1.mp4

010.hadoop-MapReduce作业提交方式、源码-客户端提交源码 2.mp4

011.hadoop-MapReduce源码-MapTask-input源码精讲.mp4

012.adoop-MapReduce源码-MapTask-output和ReduceTask精讲 2.mp4

012.adoop-MapReduce源码-MapTask-output和ReduceTask精讲 1.mp4

013.hadoop-MapReduce开发-分组取TopN-AP精炼 1.mp4

013.hadoop-MapReduce开发-分组取TopN-AP精炼 2.mp4

014.hadoop-MapReduce开发推荐系统大数据思维模式.mp4

015 Hive的架构介绍及远程数据库模式安装 1.mp4

015 Hive的架构介绍及远程数据库模式安装 2.mp4

016 Hive的远程元数据服务模式安装及Hive SOL 1.mp4

016 Hive的远程元数据服务模式安装及Hive SOL 2.mp4

017.Hive erde,HiveServer2,Hive函数 1.mp4

017.Hive erde,HiveServer2,Hive函数 2.mp4

018.Hive参数设置、运行方式、动态分区、分桶 1.mp4

018.Hive参数设置、运行方式、动态分区、分桶 2.mp4

019.Hive视图、索引、权限管理 2.mp4

019.Hive视图、索引、权限管理 1.mp4

020.Hivet化、文件类型、HiveServer2高可用 1.mp4

020.Hivet化、文件类型、HiveServer2高可用 2.mp4

021.HBase架构介绍、数据模型 2.mp4

021.HBase架构介绍、数据模型 1.mp4

022.HBase伪分布式及完全分布式安装、HBase基本命令 1.mp4

022.HBase伪分布式及完全分布式安装、HBase基本命令 2.mp4

023.HBase Java API、Protocol Buffer简单介绍 2.mp4

023.HBase Java API、Protocol Buffer简单介绍 1.mp4

024.HBase与MapReduce整合、Hbase表设计 1.mp4

024.HBase与MapReduce整合、Hbase表设计 2.mp4

025.Hbase优化及LSM树 1.mp4

025.Hbase优化及LSM树 2.mp4

026.Hadoop项目-需求介绍及数据源产生流程需求介绍及数据流图 1.mp4

026.Hadoop项目-需求介绍及数据源产生流程需求介绍及数据流图 2.mp4

027.Hadoop项目-java端和js端数据产生代码讲解及flume简单介绍 1.mp4

027.Hadoop项目-java端和js端数据产生代码讲解及flume简单介绍 2.mp4

028.Hadoop项目-Flume讲解及数据清洗模块准备工作 1.mp4

028.Hadoop项目-Flume讲解及数据清洗模块准备工作 2.mp4

029.Hadoop项目-数据清洗代码分析、hive与hbase整合、指标分析思路 1.mp4

029.Hadoop项目-数据清洗代码分析、hive与hbase整合、指标分析思路 2.mp4

030.Hadoop项目-手敲用户新增指标模块代码 1.mp4

030.Hadoop项目-手敲用户新增指标模块代码 2.mp4

031.Hadoop项目-MR输出数据到mysql的输出格式化类、sqo0p的简单介绍 2.mp4

031.Hadoop项目-MR输出数据到mysql的输出格式化类、sqo0p的简单介绍 1.mp4

032.Hadoop项目-Hive SQL分析用户浏览深度代码讲解及脚本编写 1.mp4

032.Hadoop项目-Hive SQL分析用户浏览深度代码讲解及脚本编写 2.mp4

033.redis介绍及NIO原理介绍 1.mp4

033.redis介绍及NIO原理介绍 2.mp4

034.redis的string类型&bitmap 2.mp4

034.redis的string类型&bitmap 1.mp4

035.redis的list,set,hash,sorted set、skiplist 1.mp4

035.redis的list,set,hash,sorted set、skiplist 2.mp4

036.redis消息订阅、pipeline、事务、modules、布隆过滤器、缓存LRU 2.mp4

036.redis消息订阅、pipeline、事务、modules、布隆过滤器、缓存LRU 1.mp4

037.redis的持久化RDB、fork、copyonwrite、AOF、RDB&AOF混合使用 1.mp4

037.redis的持久化RDB、fork、copyonwrite、AOF、RDB&AOF混合使用 2.mp4

038.redis的集群:主从复制、CAP、PAXOS、cluster分片集群01.mp4

039.redis的集群:主从复制、CAP、PAXOS、cluster分片集群02.mp4

040.redis开发:spring.data.redis、连接、序列化、high-low api.mp4

041.zookeeper介绍、安装、shellcli使用,基本概念验证.mp4

042.zookeeper原理知识,paxos、zab、角色功能、API开发基础.mp4

043.zookeeper案例:分布式配置注册发现、分布式锁、ractive模式编程.mp4

044.scala语言、函数式编程、数据集处理、iterator设计模式实现.mp4

045.scala语言、流程控制、高级函数.mp4

046.scala语言、集合容器、iterator设计模式源码分析.mp4

047.scala语言、match,case class、implicitt、spark wordcount.mp4

048.spark-core、复习hadoop生态、梳理术语、hadoopRDD源码分析.mp4

049.spark-core、wordcount案例源码分析、图解.mp4

050.spark-core、集合操作API、pvuv分析、RDD源码分析.mp4

051.spark-core、聚合计算API、combineByKey、分区调优.mp4

052.spark-core、二次排序、分组取TOpN、算子综合应用.mp4

053.spark-core、集群框架图解、角色功能介绍、官网学习、搭建.mp4

054.spark-core、history服务、standaloneHA、资源调度参数.mp4

055.spark-core、基于yarn的集群搭建、配置、资源调度参数、优化jars.mp4

056.spark-core-源码、RpcEnv、standaloneMaster启动分析.mp4

057.spark-core-源码、Worker启动、sparksubmit提交、Driver启动.mp4

058.spark-core-源码、Application注册、Executor资源申请.mp4

059.spark-core-源码、sparkContext、DAGScheduler、stage划分.mp4

060.spark-core-源码、Taskscheduler、Executor运行Task、SparkEnv.mp4

061.spark-core-源码、MemoryManager、BlockManager.mp4

062.spark-core-源码、Dependency、SortShuffleManager.mp4

063.spark-core-源码、SortShuffleWriter、内存缓冲区buffer.mp4

064.spark-core-源码、SortShuffleWriter、内存缓冲区buffer.mp4

065.spark-core-源码、UnsafeShufleWriter、Tungsten、Unsafe、堆外.mp4

066.spark-core-源码、ShuffleReader、Tracker、Scheduler完整调度.mp4

067.spark-core-源码、RDD持久化、检查点、广播变量、累加器.mp4

068.spark-core-源码、RDD持久化、检查点、广播变量、累加器.mp4

069.spark-sql、大数据中的SQL组成原理.mp4

070.spark-sql、datafram到dataset开发.mp4

071.spark-sql、整合hive的metastore搭建企业级数合1.mp4

072.spark-sql、整合hive的metastore搭建企业级数仓2.mp4

073.spark-sql、复杂sql、函数、自定义函数、开窗over函数、OLAP.mp4

074.spark-sql-源码、sql解析、dataset到rdd的执行计划.mp4

075.spark-sql-源码、antlr4的sql解析、AST语法树的逻辑到物理转换.mp4

076.spark-sql-源码、逻辑计划、优化器、物理计划、转换RDD.mp4

077.spark-streaming、流式计算之微批计算原理及standalone.mp4

078.spark-streaming、api、ha、检查点、窗口等机制.mp4

079.spark-streaming、整合MQ-kafka开发.mp4

080.spark-streaming、源码分析、流式微批任务的调度原理.mp4

081.spark-streaming.mp4

082.机器学习介绍、原理及应用场景.mp4

083.线性回归算法的原理及参数优化方案.mp4

084.基于Spark MLlib训练回归算法模型.mp4

085.逻辑回归算法的原理及算法公式推导.mp4

086.KNN识别手写数字与KMeans聚类算法原理.mp4

087.KNN手写数字识别及KMeans算法原理.mp4

088.手写KMeans聚类算法及实现精准微博营销案例.mp4

089.分析KMeans精准营销案例代码及KMeans在推荐系统的应用.mp4

090.逻辑回归算法原理及公式推导.mp4

091.逻辑回归算法原理及公式推导.mp4

092.逻辑回归算法及实现百度路况预测功能.mp4

093.百度地图实时路况及路况预测.mp4

094.决策树算法的原理.mp4

095.随机森林算法与算法总结.mp4

096.推荐系统的来龙去脉与推荐架构.mp4

097.推荐系统架构设计及构建推荐系统训练集.mp4

098.推荐系统代码实现及测试.mp4

099.实现推荐系统在线推荐微服务.mp4

100.基于节目的推荐系统,架构剖析,数据迁移.mp4

101.提取节目的关键词,构建节目画像.mp4

102.基于TextRank算法+TF-IDF算法提取关键词.mp4

103.构建节目画像与用户画像.mp4

104.构建用户画像及性能调优.mp4

105.基于节目画像计算节目的相似度.mp4

106.Spark调优总结及word2vec算法原理.mp4

107.基于物品画像计算相似度.mp4

108.实现基于模型的召回策略.mp4

109.构建特征中心及模型召回实现.mp4

111.训练排序模型及搭建推荐系统微服务.mp4

112.推荐系统项目一大总结.mp4

113.Flink初始及搭建集群环境.mp4

114.Flink基于Yarn多种启动方式.mp4

115.Flink运行架构及并行度设置.mp4

116.Flink各种算子精讲1.mp4

117.Flink各种算子精讲2.mp4

118.Flink各种算子精讲3 2.mp4

118.Flink各种算子精讲3 1.mp4

119.基本函数类及富函数的使用.mp4

120.Elasticsearch核心概念.mp4

121.ES环境安装、健康值检查以及CRUD.mp4

122.ES环境安装、健康值检查以及CRUD.mp4

123.Flink Checkpoint及SavePoint精讲.mp4

124.Flink Window窗口剖析1.mp4

125.上机实战演练:ES查询语法.mp4

126.Flink Window剖析2.mp4

127.Mapping和聚合查询.mp4

128.Flink时间语义+Watermark.mp4

129.Flink Window剖析3.mp4

130.ES查询之底层原理揭秘.mp4

第131节 ES查询之Scripting查询.mp4

第132节 Flink Table API 编程.mp4

第133节 ES查询之分词器详解.mp4

第134节 Flink SQL编程.mp4

第135节 Flink 复杂事件处理CEP.mp4

第136节 ES查询之前缀搜索、通配符搜索、正则搜索、模糊查询串讲.mp4

第137节 CEP编程和Flink优化.mp4

第138节 交通实时监控项目1.mp4

第139节 ES Java API.mp4

第140节 交通实时监控项目2.mp4

第141节 ES.mp4

142.本节无内容

第143节 交通实时监控项目3.mp4

第144节 交通实时监控项目4.mp4

第145节 ELK Stack-ES集群.mp4

第146节 ELK Stack-ES集群.mp4

第147节 交通实时监控项目5.mp4

第148节 ELK-Beats&Logstash介绍.mp4

第149节 ELK-Lostash架构实战.mp4

第150节 交通实时监控项目6.mp4

第151节 ELK-收集Nginx日志,syslog,kibana讲解.mp4

第152节 交通实时监控项目7.mp4

第153节 ELK-使用Packetbeat监控es集群.mp4

第154节 ES进阶-relevance score原理及排序算法优化.mp4

第155节 ES进阶-Nested、Join及Term vector详解.mp4

第156节 ES进阶-Highlight及Suggest搜索推荐详解.mp4

第157节 ES进阶-深入探秘基于地理位置搜索.mp4

第158节 ES进阶-案例分析:基于地理位置搜索的疫情地图.mp4

第159节 ES进阶-深入聚合分析-多metric以及histogram剖析.mp4

第160节 ES进阶-深入聚合搜索-完结.mp4

第161节 ES进阶-运维篇之集群管理.mp4

第162节 ES进阶-运维篇之集群管理2以及hdfs安装.mp4

第163节 ES进阶-基于snapshot hdfs restore数据备份还原.mp4

第164节 ES进阶-索引管理-1.mp4

第165节 ES进阶-索引管理-2.mp4

第166节 ES进阶-集群安全.mp4

第167节 项目实战-搜索引擎框架原理.mp4

第168节 项目实战-搜索推荐项目案例.mp4

第169节 数据仓库之数据库范式与ER实体关系模型建模.mp4

第170节 数据仓库之维度建模与数据仓库分析模型.mp4

第171节 数据仓库之数据仓库分层设计与命名规范.mp4

第172节 音乐数仓平台之项目架构及数仓分层、主题设计.mp4

第173节 数仓之歌曲影响力指数分析.mp4

第174节 数仓之歌手影响力指数分析.mp4

第175节 数仓之Sqoop全量增量数据导入.mp4

第176节 数仓之Azkaban任务流调度使用及原理.mp4

第177节 数仓之Superset BI可视化工具使用及原理.mp4

第178节 数仓之机器详情ODS.EDS.DM分层设计.mp4

第179节 数仓之机器详情自动化调度及数据可视化.mp4

第180节 数仓之用户画像表模型设计.mp4

第181节 数仓之用户画像自动化调度及数据可视化.mp4

第182节 数仓之高德api获取机器上报位置.mp4

第183节 数仓之商户、地区营收统计分析.mp4

第184节 数仓之营收分析自动化调度及数据可视化.mp4

第185节 数仓之实时用户、机器日志采集接口实现.mp4

第186节 数仓之Flume实时日志采集实现.mp4

第187节 数仓之实时用户地区日活分析.mp4

第188节 Cloudera Manager CDH 平台 01.mp4

第189节 Cloudera Manager CDH 平台 02.mp4

第190节 Cloudera Manager CDH 平台 03.mp4

第191节 Apache Kylin分析性数据仓库 01.mp4

第192节 Apache Kylin分析性数据仓库 02.mp4

第193节 Apache Kylin分析性数据仓库 03.mp4

第194节 ClickHouse 使用场景、特性与分布式搭建.mp4

第195节 ClickHouse 数据类型详解.mp4

第196节 ClickHouse 数据库引擎分类及操作.mp4

第197节 ClickHouse 表引擎分类及MergeTree引擎详解.mp4

第198节 ClickHouse 视图与SQL语法操作.mp4

第199节 Kudu分布式存储引擎架构原理及搭建.mp4

第200节 Kudu API操作及与其他框架整合.mp4

第202节 Spark操作Kudu & Flink操作Kudu.mp4

第203节 NiFi数据处理分发系统-特性、架构原理与集群搭建.mp4

第204节 NiFi数据处理分发系统-Processors介绍及页面操作.mp4

第205节 NiFi数据处理分发系统-实时同步日志、MySQL数据到Hive.mp4

第206节 NiFi数据处理分发系统-实时监控日志数据写入Kafka及消费Kafka.mp4

第207节 NiFi 案例分析.mp4

第208节 NiFi 案例分析2.mp4

第209节 数据治理-数据质量管理.mp4

第210节 数据治理-元数据管理.mp4

第211节 数据治理-数据安全管理.mp4

第212节 ETL工具Kettle-安装及基本操作.mp4

第213节 ETL工具Kettle-转换核心.作业对象.mp4

第214节 ETL工具Kettle-案例分析.mp4

第215节 ETL工具Kettle-案例分析02.mp4

第216节 ETL工具Kettle-案例分析03.mp4

第218节 数据同步工具Canal&Maxwell.mp4

第219节 Phoenix-搭建及基本操作.mp4

第220节 Phoenix-二级索引及JDBC连接.mp4

第221节 实时数仓项目-实时数仓架构演变及建设思路.mp4

第222节 实时数仓项目-各大公司实时数仓实践分享及项目介绍.mp4

第223节 实时数仓项目-实时数仓项目业务数据及日志数据处理.mp4

第224节 实时数仓项目-实时数仓业务库数据Flink编程处理.mp4

第225节 实时数仓项目-实时数仓维度数据Flink编程处理.mp4

第226节 实时数仓项目-实时数仓实时统计歌曲和歌手热度.mp4

第227节 实时数仓项目-Flink代码DM层处理及可视化展示.mp4

第228节 实时数仓项目-guava包冲突解决及用户上报位置实时统计.mp4

第229节 实时数仓项目-用户实时登录信息可视化及营收信息业务分析.mp4

第230节 时数仓项目-营收业务Flink代码实现及可视化展示.mp4

第231节 实时数仓项目-实时数仓项目总结.mp4

第232节 Hudi表类型与查询类型.mp4

第233节 Hudi与Spark、Hive、Flink集成.mp4

第234节 Apache Druid实时分析型数据库.mp4

第235节 项目轮播-数据仓库之数据库范式与ER实体关系模型建模.mp4

第236节 项目轮播-数据仓库之维度建模与数据仓库分析模型.mp4

第237节 项目轮播-数据仓库之数据仓库分层设计与命名规范.mp4

第238节 项目轮播-音乐数仓平台之项目架构及数仓分层、主题设计.mp4

第239节 项目轮播-数仓平台业务之歌曲影响力指数分析.mp4

第240节 项目轮播-数仓业务之歌手影响力指数分析.mp4

第241节 项目轮播-Azkaban任务流调度使用及原理.mp4

第242节 项目轮播-Superset BI可视化工具使用及原理.mp4

第243节 项目轮播-数仓平台业务之机器详情ODS.EDS.DM分层设计.mp4

第244节 项目轮播-数仓平台业务之机器详情自动化调度及数据可视化.mp4

第245节 项目轮播-数仓平台业务之用户画像表模型设计.mp4

第246节 项目轮播-数仓平台业务之用户画像自动化调度及数据可视化.mp4

第247节 项目轮播-数仓平台业务之高德api获取机器上报位置.mp4

第248节 项目轮播-数仓平台业务之商户、地区营收统计分析.mp4

第249节 项目轮播-数仓平台业务之营收分析自动化调度及数据可视化.mp4

第250节 项目轮播-数仓平台业务之实时用户、机器日志采集接口实现.mp4

本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用,未经站长允许禁止转载、转售本站资源。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。

最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。 若排除这种情况,可在对应资源底部留言,或联络站长QQ:502212423。

如果您已经成功付款但是无法显示下载地址,下载地址失效,请联系站长提供付款信息为您处理

教程资源、源码素材属于虚拟商品,具有可复制性,可传播性,一旦授予,不接受任何形式的退款、换货要求。请您在购买获取之前确认好是您所需要的资源