中培伟业企业IT内训课程
您现在的位置:首页 > 企业内训 > 数据库 > Greenplum技术与应用实践

Greenplum技术与应用实践

2022-04-27 10:55:19 | 来源:中培企业IT培训网
  • 课程目标
  1. 了解、掌握Greenplum系统架构,核心组件,查询执行,存储机制和事务处理
  2. 了解、掌握并实践Greenplum安装与部署,数据库、表(分区表)、视图、索引、存储过程等操作
  3. 了解、掌握并实践Greenplum数据加载与优化
  4. 了解、掌握Greenplum运维管理操作
  5. 了解、掌握Greenplum性能优化方法与原因分析
  6. 了解、掌握Greenplum与Hadoop主流大数据产品的区别与联系,Greenplum与其他MPP数据库的区别与联系
  • 课程时间
        5天 (30学时)
  • 日程安排
第一天 主题1:Greenplum基础
 
  • Greenplum基本概念
  • Greenplum系统架构
    • 大规模并行处理无共享架构特征
  • Greenplum核心组件
    • 解析器
    • 优化器
    • 调度器
    • 执行器
  • Greenplum与Hadoop大数据处理区别与联系
    • Greenplum与MapReduce
    • Greenplum与Spark
    • Greenplum与Impala
  • Greenplum适用场景
主题2:Greenplum安装部署
 
  • 环境配置,安装并初始化GPDB系统
  • 启停GPDB数据库
  • 配置GPDB系统
主题3:GPDB客户端
 
  • pgAdmin III
  • PSQL
  • JDBC
  • GPDB管理命令
第二天 主题4:PostgreSQL基础
 
  • PostgreSQL特点
  • PostgreSQL数据库安装与配置
  • PostgreSQL数据库客户端连接与使用
  • 用户管理
    • 角色创建
    • 角色权限管理
  • 数据库逻辑结构
    • cluster、database、schema
    • object、field
  • 数据库物理结构
    • tablespace、datafile、controlfile
    • segment、block
    • xlog、archivelog
主题5:PostgreSQL数据操作
 
  • PostgreSQL数据类型与类型转换
  • PostgreSQL函数
  • PostgreSQL操作符
  • PostgreSQL数据定义
    • 约束定义
    • 系统字段
    • 模式和权限
    • 分区实现与管理
  • PostgreSQL数据操作
    • 插入数据
    • 删除输出
    • 更新数据
    • 查询数据
      1. 窗口函数
      2. 组合查询
      3. 行排序
      4. limit和offset
第三天 主题6 :GP SQL常用语法
 
  • 数据库、表操作
    • 创建并管理数据库
    • 创建并管理表空间
    • 创建并管理模式
    • 创建并管理表
  • 连接查询
  • 视图操作
  • 序列操作
  • 索引操作
  • 存储过程定义与使用
主题7:PostgreSQL服务器端编程
 
  • 触发器与事件触发器
  • 规则系统
    1. 查询树
    2. 视图与规则系统
    3. 规则与触发器比较
  • 过程语言
  • PL/pgSQL过程语言
  • 服务器编程接口
主题8: 角色权限管理
 
  • 客户端认证
  • 管理用户和组
 主题9 :GPDB数据库存储
  • 数据分布式存储机制
  • 数据分布策略
  • 系统目录表
  • 数据库物理存储
  • 多态存储
    • 压缩存储
    • 行列存储与转换
  • 分区表
    • 分区表的创建与分区方式
    • 分区表添加、删除、重命名、清空与拆分
第四天 主题10 :GPDB查询与操作
 
  • GPDB SQL查询处理机制
  • 并行查询计划
  • 数据操作DML
    • UDI操作
  • 数据查询DQL
    • SELECT的OLAP分组扩展
    • ROLLUP
    • GROUPING SETS
    • CUBE
    • 窗口函数
  • 事务处理机制
    • 两阶段提交机制
    • 事务并发控制
主题11 :数据加载
 
  • 外部表加载
    • 外部表定义
    • 并行文件分布程序gpfdist
    • 外部表错误处理
  • COPY加载
  • GPLOAD加载
第五天 主题12:GPDB运维与管理
 
  • GPDB日志配置与查看
  • GPDB 备份恢复
    • 串行备份和恢复
    • 并行恢复和恢复
  • GPDB系统扩展
    • 节点的准备和添加
    • 初始化新Instance
    • 重分布表
  • GPDB高可用
    • 镜像Segment
    • 热备Master
主题13:PostgreSQL性能优化
 
  • explain的使用
  • 规划器
  • 常用优化技术
主题14 :GPDB性能调优
 
  • 常见性能问题与原因分析
    • 硬件问题
    • 资源竞争
    • 数据分布
    • 索引设计
    • SQL编写
  • 跟踪性能问题
  • 查询程序分析与优化
    • EXPLAIN, EXPLAIN ANALYZE
 
 
 

相关阅读