java php asp.net 安卓 云计算 数据库

Hive开发应用

价格:700
总课时:54课时 发布时间:2015年

简介

机器学习,一切简单化!

收看本课程的其它同学

 • sky_3013

 • 爱浪曦

 • wpj1157350332

 • hero_li

 • sunshineliu

 • wuliepeng

 • xiaoluo

 • wangbang410

 • kingzuo

 • 已有929人购买

  浪曦星际一卡通

 • 已有381人购买

  Spring源码解读与设计详析

 • 已有379人购买

  浪曦OA与工作流系统

 • 已有315人购买

  Java常见笔试、面试系列

 • 已有305人购买

  风中叶2016述职规划全程讲座分享

 • 已有295人购买

  浪曦CRM企业级开发应用系统

 • 已有257人购买

  Git应用开发详解(体验)

 • 已有232人购买

  Mysql高级海量数据存储和优化

 • 已有227人购买

  圣思园视频

 • 已有193人购买

  Oracle DBA系列教程

 • 课程简介
 • 课程目录
 • 课程评价(0)

第一阶段 Hive基础篇

1. Hive产生的背景

Ø Hive产生的背景

Ø Hive的发展历程

2. 什么是Hive

Ø Hive的概述

Ø Hive在Hadoop生态系统中的位置

Ø Hive的架构

Ø Hive的发展趋势

3. Hive的源码编译与配置

Ø Hive源代码的编译

Ø Hive环境的搭建

Ø Hive的启动

·Hive shell

·Hiveserver2/Beeline

Ø Hive的基本命令

4. HiveDDL

Ø 数据库:创建、删除、修改

Ø 表:创建、删除、修改

5. HiveDML

Ø 常用操作

Ø 数据加载

Ø 数据的导入导出

6. Hive内部表和外部表

Ø 内部表和外部的创建、删除和修改

Ø 数据的加载

·本地

·分布式文件系统

Ø 数据导出的几种方式

Ø 内部表&外部表

7. Hive的内置函数

Ø 查询hive已有的内置函数

Ø 使用Hive已有的内置函数

第二阶段 Hive的入门篇

1. 分区表和桶表

Ø 分区表

·静态分区(单级、多级)

·动态分区(单级、多级)

Ø 桶表

2. Hive的数据类型

Ø 基本数据类型

Ø 复杂数据类型

·ARRAY

·MAP

·STRUCT

3. Hive的元数据的分析

Ø VERSION

Ø TBLS

Ø DBS

Ø …

4. Hive的排序

Ø ORDER BY

Ø SORT BY

Ø …

5. Hivejoin

Ø Shuffle JOIN

Ø MAP JOIN

Ø SMB JOIN

6. Hive的存储格式

Ø TextFile

Ø SequenceFile

Ø …

7. Hive的压缩格式

Ø Snappy

Ø …

8. Hive的自定义UDF

第三阶段 Hive的编程篇

1. 深入Hive的心脏:内部机理

深度剖析Hive如何将HQL语言解析成底层的MapReduce任务。

2. Hive的案例

3. Hive的性能调优

Ø 数据倾斜分析及常用解决方案

Ø Join的合理使用

Ø 压缩格式的使用

Ø …

4. Hive的总结

Ø 本部分将重点介绍在工作中遇到Hive相关的问题。