Redshift有以下几种实例类型:
DC2 容量小
DS2 容量大
RA3。前面两种机型要被淘汰,RA3真正做到了存储和计算分离
从2020年开始,和EC2一样,Redshift改成按秒计费的,计费粒度不再以小时来算。
RA3 是 Redshift 第三代架构,它的演进历程如下:
DC2(计算密集,本地SSD)
↓
DS2(存储密集,本地HDD)← 已废弃
↓
RA3(计算存储分离,托管存储)← 当前主推
节点规格:
| 节点类型 | vCPU | 内存 | Slice 数 | 存储配额/节点 | 节点数范围 | 最大存储 |
|---|---|---|---|---|---|---|
| ra3.xlplus | 4 | 32 GB | 2 | 32 TB | 1-16 | 1 PB |
| ra3.4xlarge | 12 | 96 GB | 4 | 128 TB | 2-32 | 8 PB |
| ra3.16xlarge | 48 | 384 GB | 16 | 128 TB | 2-128 | 16 PB |
核心架构如下:
┌─────────────────┐
│ Leader Node │ ← 协调、解析、分发
└────────┬────────┘
│
┌───────────────────┼───────────────────┐
▼ ▼ ▼
┌─────────────────┐ ┌─────────────────┐ ┌─────────────────┐
│ Compute Node │ │ Compute Node │ │ Compute Node │
│ ┌───────────┐ │ │ ┌───────────┐ │ │ ┌───────────┐ │
│ │ 本地 SSD │ │ │ │ 本地 SSD │ │ │ │ 本地 SSD │ │
│ │ (热数据) │ │ │ │ (热数据) │ │ │ │ (热数据) │ │
│ └─────┬─────┘ │ │ └─────┬─────┘ │ │ └─────┬─────┘ │
└────────┼────────┘ └────────┼────────┘ └────────┼────────┘
│ │ │
└───────────────────┼───────────────────┘
▼
┌──────────────────────────┐
│ Redshift Managed │
│ Storage (RMS) │ ← 底层 S3
│ 冷数据 + 持久化存储 │
└──────────────────────────┘
| 传统方式 (DC2) | RA3 方式 |
|---|---|
| 要存更多数据?加节点 | 存储自动扩展,不加节点 |
| 要更多算力?加节点(存储也跟着加) | 只加计算节点,存储不变 |
| 付费:计算+存储捆绑 | 付费:计算和存储分开算 |
| 数据温度 | 存储位置 | 访问速度 |
|---|---|---|
| 热数据(高频访问) | 本地 SSD 缓存 | ⚡ 最快 |
| 温数据 | RMS 快速层 | 🚀 快 |
| 冷数据(低频访问) | RMS(S3) | 📦 标准 |
Redshift 自动管理数据放哪里,无需手动干预。
| 特性 | 说明 |
|---|---|
| 高带宽网络 | 数据快速在计算节点和 S3 间传输 |
| 高性能 SSD | 本地缓存用 NVMe SSD |
| 硬件加速 | AQUA 用 FPGA 加速查询 |
| 功能 | 说明 | DC2 支持 |
|---|---|---|
| AQUA | 硬件加速查询,快 10 倍 | ❌ |
| Data Sharing | 跨集群共享数据,不复制 | ❌ |
| Cross-database Query | 跨数据库查询 | ❌ |
| Concurrency Scaling 写操作 | ETL 并发扩展 | ❌ |
| 集群relocation | 跨 AZ 迁移,零 RPO | ❌ |
| Managed VPC Endpoints | 跨账号/VPC 私有访问 | ❌ |