java php asp.net 安卓 云计算 数据库

Hive开发应用

价格:700
总课时:54课时 发布时间:2015年

简介

机器学习,一切简单化!

收看本课程的其它同学

  • sky_3013

  • liydl

  • 爱浪曦

  • wpj1157350332

  • hero_li

  • sunshineliu

  • wuliepeng

  • xiaoluo

  • wangbang410

  • 已有962人购买

    浪曦星际一卡通

  • 已有377人购买

    浪曦OA与工作流系统

  • 已有341人购买

    Spring源码解读与设计详析

  • 已有304人购买

    Java常见笔试、面试系列

  • 已有295人购买

    浪曦CRM企业级开发应用系统

  • 已有283人购买

    风中叶2016述职规划全程讲座分享

  • 已有240人购买

    Mysql高级海量数据存储和优化

  • 已有238人购买

    Git应用开发详解(体验)

  • 已有230人购买

    圣思园视频

  • 已有192人购买

    Oracle DBA系列教程

  • 课程简介
  • 课程目录
  • 课程评价(0)

第一阶段 Hive基础篇

1. Hive产生的背景

Ø Hive产生的背景

Ø Hive的发展历程

2. 什么是Hive

Ø Hive的概述

Ø Hive在Hadoop生态系统中的位置

Ø Hive的架构

Ø Hive的发展趋势

3. Hive的源码编译与配置

Ø Hive源代码的编译

Ø Hive环境的搭建

Ø Hive的启动

·Hive shell

·Hiveserver2/Beeline

Ø Hive的基本命令

4. HiveDDL

Ø 数据库:创建、删除、修改

Ø 表:创建、删除、修改

5. HiveDML

Ø 常用操作

Ø 数据加载

Ø 数据的导入导出

6. Hive内部表和外部表

Ø 内部表和外部的创建、删除和修改

Ø 数据的加载

·本地

·分布式文件系统

Ø 数据导出的几种方式

Ø 内部表&外部表

7. Hive的内置函数

Ø 查询hive已有的内置函数

Ø 使用Hive已有的内置函数

第二阶段 Hive的入门篇

1. 分区表和桶表

Ø 分区表

·静态分区(单级、多级)

·动态分区(单级、多级)

Ø 桶表

2. Hive的数据类型

Ø 基本数据类型

Ø 复杂数据类型

·ARRAY

·MAP

·STRUCT

3. Hive的元数据的分析

Ø VERSION

Ø TBLS

Ø DBS

Ø …

4. Hive的排序

Ø ORDER BY

Ø SORT BY

Ø …

5. Hivejoin

Ø Shuffle JOIN

Ø MAP JOIN

Ø SMB JOIN

6. Hive的存储格式

Ø TextFile

Ø SequenceFile

Ø …

7. Hive的压缩格式

Ø Snappy

Ø …

8. Hive的自定义UDF

第三阶段 Hive的编程篇

1. 深入Hive的心脏:内部机理

深度剖析Hive如何将HQL语言解析成底层的MapReduce任务。

2. Hive的案例

3. Hive的性能调优

Ø 数据倾斜分析及常用解决方案

Ø Join的合理使用

Ø 压缩格式的使用

Ø …

4. Hive的总结

Ø 本部分将重点介绍在工作中遇到Hive相关的问题。