读序
02
08
大数据技术之Azkaban 大数据技术之Azkaban
第1章 Azkaban概论1.1 为什么需要工作流调度系统1)一个完整的数据分析系统通常都是由大量任务单元组成:Shell脚本程序,Java程序,MapReduce程序、Hive脚本等2)各任务单元之间存在时间先后及前后依赖关系3)为了很好
07
06
大数据项目之尚品汇(2业务数据采集平台) 大数据项目之尚品汇(2业务数据采集平台)
第1章 电商业务简介1.1 电商业务流程电商的业务流程可以以一个普通用户的浏览足迹为例进行说明,用户点开电商首页开始浏览,可能会通过分类查询也可能通过全文搜索寻找自己中意的商品,这些商品无疑都是存储在后台的管理系统中的。当用户寻找到自己中意
2022-02-06
05
大数据技术之Flume 大数据技术之Flume
大数据技术之Flume第2章 Flume入门2.1 Flume安装部署2.1.1 安装地址 Flume官网 文档查看 下载地址 2.1.2 安装部署(1)将apache-flume-1.9.0-bin.tar.gz上传到linux的/op
04
03
大数据技术之Zookeeper 大数据技术之Zookeeper
大数据技术之Zookeeper第3章 Zookeeper实战(开发重点)3.1 分布式安装部署1)集群规划在hadoop102、hadoop103和hadoop104三个节点上部署Zookeeper。2)解压安装(1)解压Zookeeper
02
大数据技术之Hadoop(入门) 大数据技术之Hadoop(入门)
大数据技术之Hadoop(入门)第1章 完全分布式运行模式(开发重点)分析: 1)准备3台客户机(关闭防火墙、静态IP、主机名称) 2)安装JDK 3)配置环境变量 4)安装Hadoop 5)配置环境变量
01
01
31
大数据技术之Shell 大数据技术之Shell
第1章 Shell概述大数据程序员为什么要学习Shell呢?1)需要看懂运维人员编写的Shell程序。2)偶尔会编写一些简单Shell程序来管理集群、提高开发效率。 第2章 Shell解析器(1)Linux提供的Shell解析器有: [
2022-01-31 读序
11
算法与数据结构之树结构实际应用 算法与数据结构之树结构实际应用
堆排序堆排序基本介绍 堆排序是利用堆这种数据结构而设计的一种排序算法,堆排序是一种选择排序,它的最坏,最好,平均时间复杂度均为 O(nlogn),它也是不稳定排序。 堆是具有以下性质的完全二叉树:每个结点的值都大于或等于其左右孩子结点的值
2022-01-11
10
算法与数据结构之树结构的基础部分 算法与数据结构之树结构的基础部分
树结构的基础部分二叉树为什么需要树这种数据结构 数组存储方式的分析优点:通过下标方式访问元素,速度快。对于有序数组,还可使用二分查找提高检索速度。缺点:如果要检索具体某个值,或者插入值(按一定顺序)会整体移动,效率较低 [示意图]画出操作示
2022-01-10
09
算法与数据结构之哈希表 算法与数据结构之哈希表
哈希表哈希表(散列)-Google 上机题 看一个实际需求,google 公司的一个上机题: 有一个公司,当有新的员工来报道时,要求将该员工的信息加入(id,性别,年龄,住址..),当输入该员工的 id 时,要求查找到该员工的 所有信息.
2022-01-09
11 / 12