1.
Redshift入门
1.
列式存储
2.
Massively Parallel Processing
4.
设置server coniguration
5.
Redshift Spectrum
7.
Redshift的几种实例类型
2.
实验 - 分析IMDb电影数据
2.
为Redshift集群绑定Role
2.
集群创建
3.
加载数据
4.
执行SQL分析数据
5.
Redshift Spectrum
6.
使用quicksight展示数据
7.
unload导出数据
8.
物化视图
3.
Loading data实践
1.
并行导入数据
2.
Zone maps和Sort key
3.
VACUUM
4.
Compression
5.
Data Distribution
6.
merge/upsert操作
4.
Redshift查询
1.
Query Caching
3.
WLM
5.
Redshift运维
1.
Event Subscription
1.
Redshift Resize
2.
Redshift Pause
2.
集群加密
3.
Cross region snapshot
5.
Redshift系统信息表
6.
Audit Log
7.
Workload Management - WLM
13.
Usage Limits
6.
实验 - Redshift表优化
1.
加载数据
2.
测试优化前性能
3.
对表进行优化
4.
重新导入数据
5.
测试优化后性能
7.
Security
1.
创建Redshift Private Cluster
2.
Manged VPC endpoints
3.
Enhance VPC Routing
8.
Redshift Data Sharing
1.
创建两个Redshift集群
2.
创建Data Sharing
3.
验证Data Sharing效果
4.
权限管理 - Add / Remove Objects
5.
权限管理 - Role based Access Control
6.
Audit Log
7.
跨帐号DataShare I
8.
跨帐号DataShare II
9.
跨帐号DataShare III
9.
Redshift Deep Dive
1.
Redshift创建及导入数据
2.
Analyze及Vaccum命令
3.
Data API
4.
Spectrum查询优化
5.
Semi-structured data
6.
Redshift ML
7.
77
清除历史
Redshift
> 实验 - 分析IMDb电影数据
实验 - 分析IMDb电影数据
本章我们将以实际IMDb电影数据集导入Redshift,并对数据进行分析。
我们将:
创建Redshift集群
下载电影数据,并将数据导入Redshift
在Redshift执行SQL语句
测试
Redshift Spectrum
使用Quicksight对Redshift的查询结果进行展示,并使用它的SPICE来加速展示
使用unload将Redshift的查询结果导出到S3
对查询建立物化视图,来缓存经常执行的查询语句