Redshift RA3实例

Redshift有以下几种实例类型:

  • DC2 容量小

  • DS2 容量大

  • RA3。前面两种机型要被淘汰,RA3真正做到了存储和计算分离

从2020年开始,和EC2一样,Redshift改成按秒计费的,计费粒度不再以小时来算。


RA3 是 Redshift 第三代架构,它的演进历程如下:

DC2(计算密集,本地SSD)
    ↓
DS2(存储密集,本地HDD)← 已废弃
    ↓
RA3(计算存储分离,托管存储)← 当前主推

节点规格:

节点类型 vCPU 内存 Slice 数 存储配额/节点 节点数范围 最大存储
ra3.xlplus 4 32 GB 2 32 TB 1-16 1 PB
ra3.4xlarge 12 96 GB 4 128 TB 2-32 8 PB
ra3.16xlarge 48 384 GB 16 128 TB 2-128 16 PB

核心架构如下:

                    ┌─────────────────┐
                    │   Leader Node   │  ← 协调、解析、分发
                    └────────┬────────┘
                             │
         ┌───────────────────┼───────────────────┐
         ▼                   ▼                   ▼
┌─────────────────┐ ┌─────────────────┐ ┌─────────────────┐
│   Compute Node  │ │   Compute Node  │ │   Compute Node  │
│  ┌───────────┐  │ │  ┌───────────┐  │ │  ┌───────────┐  │
│  │ 本地 SSD  │  │  │  │ 本地 SSD  │  │ │  │ 本地 SSD   │  │
│  │ (热数据)  │   │ │  │ (热数据)   │  │ │  │ (热数据)   │  │
│  └─────┬─────┘  │ │  └─────┬─────┘  │ │  └─────┬─────┘  │
└────────┼────────┘ └────────┼────────┘ └────────┼────────┘
         │                   │                   │
         └───────────────────┼───────────────────┘
                             ▼
              ┌──────────────────────────┐
              │   Redshift Managed       │
              │   Storage (RMS)          │  ← 底层 S3
              │   冷数据 + 持久化存储       │
              └──────────────────────────┘

RA3 核心优势

  1. 计算存储独立扩展
传统方式 (DC2) RA3 方式
要存更多数据?加节点 存储自动扩展,不加节点
要更多算力?加节点(存储也跟着加) 只加计算节点,存储不变
付费:计算+存储捆绑 付费:计算和存储分开算
  1. 智能数据分层
数据温度 存储位置 访问速度
热数据(高频访问) 本地 SSD 缓存 ⚡ 最快
温数据 RMS 快速层 🚀 快
冷数据(低频访问) RMS(S3) 📦 标准

Redshift 自动管理数据放哪里,无需手动干预。

  1. AWS Nitro 系统加持
特性 说明
高带宽网络 数据快速在计算节点和 S3 间传输
高性能 SSD 本地缓存用 NVMe SSD
硬件加速 AQUA 用 FPGA 加速查询

RA3 独有功能

功能 说明 DC2 支持
AQUA 硬件加速查询,快 10 倍
Data Sharing 跨集群共享数据,不复制
Cross-database Query 跨数据库查询
Concurrency Scaling 写操作 ETL 并发扩展
集群relocation 跨 AZ 迁移,零 RPO
Managed VPC Endpoints 跨账号/VPC 私有访问