Lindorm 一站式车联网
数据平台
葛双博
阿里云高级产品专家
国标
GB_T 32960
企标
智能业务
数千项指标
汽车保有量
百万级 / 千万级
数据采集频度
100ms/1s/10s
100+ 项指标
PB+ 规模数据
成本 性能
数千列大宽表实时写入
数千亿数据实时检索
多元化
存储、检索、计算、 AI
动态列
车辆增加信号
车联网数据特点
第三方机构观点 /数据,仅供参考,不代表本公司观点 /研究数据
• 车辆状态实时监控 / 告警
• 实时地理围栏计算和告警
实时计算
• Flink
• Spark Streaming
• 自己开发流计算代码
存储和检索
• 存 储 成 本和 存 储 规模 。 在 线扩 容 , 冷热
分离 、 压缩率 。
• 一 辆 车 一张 表 , 维护 难 。 如何 实 现 所 有
车一张表 。
• 业务灵活变更 , 如何动态增加字段 ?
• 轨迹查询 , 时空查询 。
• 车 ID+ 时间范围检索 , 多维检索
• HBase/MongoDB + ES
分析计算
• 车辆运营分析
• 电池分析
• 车辆状态分析
• 时空聚类
• 轨迹相似性分析
• ……
• HDFS+Hive+Spark
技术栈复杂
多产品组合
多条数据链路
开发门槛高
各产品架构原理、 API 、
运维等完全不一样
存储碎片化
产品数据冗余
扩展性挑战
如何动态增加字段?
架构如何跟随业务迭代 ?
传统开源技术栈的痛点
Lindorm 一站式车联网数据平台
宽表:点查 + 搜索
倒排索引
列存索引
列存:分析
BLOB
推理分析
向量化
实时
写入
批量
写入
AI 服务
数据不出库
在线服务 + 离线分析 + AI
一站式
非结构化数据存储 (文本、文档、图片、图像等 ) 向量引擎
Lindorm
在线
查询
离线
分析
智能
应用
半结构化 + 非结构化 数据
向量 + 标量
语言大模型 + 多模态大模型
多模态
存算分离,在线扩容
千万吞吐,毫秒延迟
百 PB 规模
2 - 10 倍压缩,冷热分离
Serverless 弹性计算
20% 成本
推理
分析
流
引
擎
(CEP+UDF)
故障预警
模型训练
详单查询
报表分析
电池分析
数据标注
泛时序
数据
半结构化
非结构化
数据
数据 车联网应用
Lindorm SQL( 兼容 MySQL 协议 )
(灵积、魔搭
LLM 、 Embedding)
模型服务
(异构算力 :GPU+CPU)
推理引擎
HBase Prometheus ElasticSearch HDFS Hive Spark OpenTSDB
降本、增效 开源架构升级
40% 头部车企 5 0% 造车新势力
多模在线宽表
以宽表呈现的逻辑试图 (CREATE TABLE DemoTable )
SQL
动态列 稀疏表 行级 TTL 多版本
LDFS 共享存储池
column5
Lindorm一站式AI数据平台实战.pdf