navigation

Redshift是AWS的数据仓库服务,可以对PB级别数据运行复杂查询,GCP对标产品是BigQuery

它的架构如下,分为Leader nodeCompute node

img

一个Redshift集群至少由一个计算节点(compute node)组成,它上面分为多个slice,每个slice上有独自的磁盘和内存资源。每个node的slice数量由节点大小决定

如果有两个以上的compute node,则需要一个额外的Leader node来协调SQL查询,它与用户直接交互,此时compute node对用户是无感知的。Leader node用户执行查询计划,以及将compute node的查询结果做聚合返回给用户