构建端到端可观测体系,打造云上可观测最佳实践阿里云云原生技术专家曾庆国
讲师介绍曾庆国(悦达)KubeVela社区Maintainer。阿里云智能技术专家。长期从事云原生可观测、应用持续交付、基础设施管理等云原生领域,积累大量基于Kubernetes 的云原生应用管理平台建设经验和可观测领域实践经验。曾帮助工业互联网、金融和企业办公等多个行业头部用户完成云原生DevOps 转型。KubeCon、ArchSummit、Gopher、SDCon、A2M等大会讲师。
Full Stack Observability我们需要什么形态的云上可观测?
云上可观测的挑战全球化业务需求、多云、分布式云战略落地,使企业建设“统一”可观测能力难度进一步增加自身性能和稳定性挑战超过63%的企业组织拥有超过10种以上的工具急需统一的观测数据模型数据和工具割裂技术架构、技术组件迭代快,可观测能力发挥严重依赖专家经验“无法兑现的价值”业务规模扩大,观测数据指数增长数据读写性能和投入产出比面临挑战成本膨胀数据来源于Enterprise Strategy Group (ESG) 的一项调查
与国内外开源社区技术技术发展路线匹配阿里云可观测十年,从自研走向开放的全栈可观测以ARMS 应用实时监控服务、Prometheus服务、Grafana服务和全托管OpenTelemetry服务为核心,打造云原生时代标准开发可观测数据生态与产品前端监控、APP监控、云拨测基于Prometheus 容器监控多语言链路追踪内部工具商业化,围绕微服务应用,结合trace、metric、log提供应用可观测能力打通了淘系所有常见中间件的调用数据;大促和单元化的容量规划、依赖分析提供了数据支撑和故障定位能力EagleEyeARMS 应用实时监控服务全栈可观测能力云原生可观测服务以场景+数据为中心丰富、好用的生态能力20132017202020222023未来数据融合,体验简单,成本低廉。在可靠的平台能力基础之上,推出以写入数据量(GB)的统一计费模式;打造基础设施+应用的多个场景化观测方案。
How to apply Full Stack Observability云原生全栈可观测怎么做?
做决策:全面实施全栈可观测优势和挑战并存优势挑战提供业务运行能见度,更快的解决问题数据驱动决策,改善用户体验更高的资源利用率和可靠性促进协作和协调,持续改进较高的复杂性,如何选择正确的工具集组织文化变革数据安全和数据解释综合成本较高系统性能开销
找方案:“场景”+“数据”流构建端到端全栈可观测方案``Prometheus指标存储实例可观测存储数据被集成可观测平台能力主机•支持云原生模式采集主机基础观测数据;•支持大规模
构建端到端可观测体系,打造云上可观测最佳实践.pdf