AIGC 时代下的企业级智能数仓
AnalyticDB 揭秘
林亮
阿里云智能 研究员
姚奕玮
AnalyticDB PostgreSQL 版
产品部负责人
AnalyticDB for MySQL
林亮
阿里云研究员
TECH Session
Data Growth Drives Business Evolution
数据增长 驱动 业务演进
数据规模
275 %
数据 规模增速 202 7 vs 202 2
2027 全球 数据规模
291 ZB
✓ 报表 & 大屏
✓ ELT
✓ 实时分析
✓ 湖仓融合
✓ 智能预测
单客户
数据规模
GB TB PB
业
务
价
值
AnalyticDB for MySQL
1.0
2012
AnalyticDB for MySQL
2.0
2016
AnalyticDB for MySQL
3.0
2018
数据库的易用、大数据的规模
处理 / 分析一体化
数据集成 数据处理 数据归一 数据分析 数据源
OLTP 数据库
企业应用
三方数据
日志数据
IoT 数据
数据消费
即席分析
实时分析
看板报表
云原生数据仓库 AnalyticDB MySQL
整体技术架构
Architecture
orc.png
OSS
内部存储
XIHE MPP SQL
Engine
XIHE BSP SQL Engine
外部存储
Storage APIs ( Arrow 格式)
存储层
计算层
数据库
(RDS/ PoralDB )
日志
(OSS/Kakfa/SLS)
数据管道
APS
大数据
( MC/EMR )
数据源
拥抱开源
统一元数据 /权限 访问层
采
存
算
管
做深 自研
Spark Engine
全量数据层(索引数据)
实时数据层
同时满足在离线处理,
提高数据一致性和时效性
一份
数据
融合 MPP 和 BSP 两种执行
模型,一个引擎一份资源
融合
引擎
在线分析任务支持 分时弹
性 ,离线处理任务支持
Query 级
按需弹性
极致
弹性
复杂离线处理 /ML ,
自建 Spark 迁移
Spark
引擎
新增数据更新、
数据多版本等能力
开放
格式
Spark 可以读写仓存储,
XIHE 高效读写湖格式
打通
内外
智能
化
Intelligence
一体化
Integrated
云 原生化
Cloud Native
核心技术方向
Core Technologies
Serverless 调度
Serverless Scheduling
神龙裸金属、 ECS 、 ECI 统一资源
池
资源统一管理,保障弹性高成功率,支持不同类型和规模的负载
弹性效率提升
大规模的弹性扩缩容,应对突发业务变化;基于历史指标画像,自动化管理
在离线一体化部署
在离线混部、多租户资源隔离和保障
orc.png
多集群自动弹性
Auto Multi -Cluster
orc.png
自动多 Cluster 路由 / 资源隔离
查询在多 cluster 间自动路由、负载均衡、资源隔离等
支持更高并发度
相比单集群扩展, Multi -Cluster 可以
支持更高并发
基于负载的
AIGC时代下的企业级智能数仓 AnalyticDB揭秘.pdf