读序
Flask Web框架入门 Flask Web框架入门
Flask是一个轻量级的基于Python的web框架。 1. 简介这份文档中的代码使用 Python 3 运行。是的,所以读者需要自己在电脑上安装Python 3 和 pip3。建议安装最新版本,我使用的是Python 3.6.4。安装方法
Spark常用RDD算子 Spark常用RDD算子
RDD 创建 在 Spark 中创建 RDD 的创建方式可以分为四种: 从集合(内存)中创建 RDD 从集合中创建 RDD,Spark 主要提供了两个方法:parallelize 和 makeRDD val sparkConf =
大数据技术之Flink 大数据技术之Flink
第一章 Flink 简介1.1 初识 FlinkFlink 项目的理念是:“Apache Flink 是为分布式、高性能、随时可用以及准确的流处理应用程序打造的开源流处理框架”。Apache Flink 是一个框架和分布式处理引擎,用于对无
大数据技术之Azkaban 大数据技术之Azkaban
第1章 Azkaban概论1.1 为什么需要工作流调度系统1)一个完整的数据分析系统通常都是由大量任务单元组成:Shell脚本程序,Java程序,MapReduce程序、Hive脚本等2)各任务单元之间存在时间先后及前后依赖关系3)为了很好
大数据技术之Flume 大数据技术之Flume
大数据技术之Flume第2章 Flume入门2.1 Flume安装部署2.1.1 安装地址 Flume官网 文档查看 下载地址 2.1.2 安装部署(1)将apache-flume-1.9.0-bin.tar.gz上传到linux的/op
大数据技术之Kafka 大数据技术之Kafka
大数据技术之Kafka第2章 Kafka快速入门2.1 安装部署2.1.1 集群规划 hadoop102 hadoop103 hadoop104 zk zk zk kafka kafka kafka 2.1.2 jar包下
大数据技术之Zookeeper 大数据技术之Zookeeper
大数据技术之Zookeeper第3章 Zookeeper实战(开发重点)3.1 分布式安装部署1)集群规划在hadoop102、hadoop103和hadoop104三个节点上部署Zookeeper。2)解压安装(1)解压Zookeeper
大数据技术之Hadoop(入门) 大数据技术之Hadoop(入门)
大数据技术之Hadoop(入门)第1章 完全分布式运行模式(开发重点)分析: 1)准备3台客户机(关闭防火墙、静态IP、主机名称) 2)安装JDK 3)配置环境变量 4)安装Hadoop 5)配置环境变量