云原生可观测Prometheus:构建开放的全栈可观测能力徐葛阿里云可观测产品专家
Contents目录01可观测挑战和趋势分享02基于PrometheusxGrafana构建开放的全栈可观测能力03全栈可观测最佳实践分享
可观测落地挑战和趋势Observable Challengesand Trends01
企业建设可观测能力核心挑战数据和工具割裂超过63%的企业组织拥有超过10种 以上的工具没有统一的观测数据模型*成本膨胀业务规模扩大,观测数据指数增长数据读写性能和投入产出比面临挑战“无法兑现的价值”技术架构、技术组件迭代快,可观测能力发挥严重依赖专家经验全球化业务需求、多云、分布式云战略落地,使企业建设“统一”可观测能力难度进一步增加*引用ESG调查和信通院《可观测性成熟度白皮书》自身性能和稳定性挑战
打通了淘系所有常见中间件的调用数据;大促和单元化的容量规划、依赖分析提供了数据支撑和故障定位能力EagleEye内部工具商业化,围绕微服务应用,结合Trace、Metric、Log提供应用可观测能力ARMS 应用实时监控服务前端监控、APP监控、云拨测基于Prometheus 容器监控多语言链路追踪全栈可观测能力云原生可观测服务2013201720202022阿里云可观测十年,从自研走向开放全栈可观测以 ARMS 应⽤实时监控服务、可观测监控 Prometheus 版、可观测可视化 Grafana 版、可观测链 OpenTelemetry 版为核⼼,打造云原生时代标准开发可观测数据生态与产品
统一标准而不是统一存储连接价值而不是搬运数据建设可观测系统而不是建设数据存储系统全栈可观测是企业可观测能力核心具备全栈可观测性的组织,其年平均停机成本下降了 37%,可观测性的平均投资回报率能提高了 14% 。**引自《2023 Observability Forecast》by New Relic
基于PrometheusxGrafana构建开放全栈的可观测能力02New Future on Cloud
····PrometheusOpenTelemetry开源标准的数据模型和观测界面数据完全兼容 Prometheus 和 OpenTelemetry 协议,核心观测完全基于 Grafana 大盘开放数据探索能力用户从使用数据到真正「拥有数据」,使企业能发挥可观测数据最大价值统一接入统一标准数据存储数据探索CRM 用户体验Grafana应用监控中间件监控容器监控云产品监控调用链分析指标探索OpenAPIRemote ReadRemote Write数据投递200+ 开箱即用的数据集成基于阿里内部专家经验沉淀的 300+ 观测大盘、1000+ 告警规则模版更丰富、更开放的生态集成能力
指标级成本洞悉以指标为基本单元,构建全局指标上报量聚合视图。直观洞悉指标的成本占比
云原生可观测Prometheus:构建开放的全栈可观测能力.pdf