admin 2025-09-24
82
36篇干货文章+16个直播议题回顾,包含可观测性、智能运维、监控告警、故障急救小妙招、运维转型体系建设等热门内容,快来解锁周末假期的又一正确打开方式吧!
可观测性
每日百亿查询请求,这么庞大的系统是咋敢玩可观测性的呢?-百度搜索中台
全链路根因定位,虎牙APM可观测平台建设实践-匡凌轩
入坑可观测体系建设后,才发现会遇到这么多难题……-陈成禧
PB级日志高效处理!去哪儿网分布式追踪系统实践-王鹏
智能运维
一次令人窒息的云事故,逼我们肝出这个智能监控平台……-柯圣
京东科技全链路故障诊断智能运维实践-张静
用ClickHouse搭智能运维可观测性平台,简直不要太香……-高鹏
浙江移动云原生运维数智化转型实践-王晓征
建设银行在智能运维上的探索与实践-包航宇
监控告警
减少90%无效告警!苦熬3年终于能睡整觉了……-程田大明
说出运维人的心声:为何监控如此痛苦?-MathewDuggan
Prometheus监控指标查询性能调优-爱奇艺会员技术团队
异常定位准确又高效!去哪儿网根因分析实践-梁成琰
大厂性能测试监控指标及分析调优指南-牛金亮
不要Prometheus,容器集群监控系统架构如何对症下药?-王坤
适配金融业的应用监控标准化演进之路-胖亚鹏
详解Prometheus四种指标类型,谁还不是个监控老司机了-小灰灰
故障急救小妙招
八大生产故障的通用排查思路(不收藏后悔系列)-悟空
一次棘手的容器故障,我终于知道SRE有多重要了……-Gin
风险预警的架构这样做,让故障扼杀在摇篮之中……-谷林涛
我的血泪故障复盘史,写给不想被祭天的运维-我是羽北
肝完这篇稳定性建设万字总结,谁还吐槽我线上不稳定!-itegel
大促稳定性保障深度复盘,包含应对措施和案例分析-Lost
程序运行慢到离谱,谁想到数据库分片导致的……-池剑锋
第一次操盘大促,稳定性保障如何做到万无一失?-孟闯
运维转型体系建设
CMDB建设,为何最终总被沦为鸡肋?-三页
说出运维人的心声:为何监控如此痛苦?-MathewDuggan
DevOps是扯淡,让运维和开发都不堪重负?-CoryO’Daniel
平台工程搭完,运维岗位真的不能干了吗?-三页
业务指数级增长,可用性建设也可以如此稳当?-周甲黎
这套SLO报警与运营体系,不允许还有SRE没看过!-武安闯
B站服务稳定性建设:高可用架构与多活治理-吉翔
救火运维逆袭攻略:云原生+DevOps+SRE+ITIL-刘亚丹
降本增效没起色,CTO喊话造了这个效能平台-方勇
降本30%+增效40%,这样落地FinOps省钱又省力!-钟仕骏
云成本节省上亿,得物FinOps落地实践-家琪子狐Gin
精选16个热门直播+配套PPT干货
1、中国银行运维转型与敏捷开发探索实践:
《中国银行的运维监控体系建设》
《混沌工程在中国银行的探索与实践》
《中国银行基于质量内建的DevOps实践》
2、甩掉技术债包袱,B站的SRE体系建设与转型实践:
《服务稳定性建设:高可用架构与多活治理》
《B站应用降本增效与容量运营治理》
《SLO运营体系与报警:如何从工程理论探索到最佳实践》
《B站风险预警的架构设计及落地实践》
3、聚焦云原生新范式重塑IT运维核心竞争力:
《如何构建云原生可观测性体系》
《构建全生命周期的云原生安全防护》
《中小银行可用性和应急管理应用与实践》
4、重塑IT运维新模式,探索新兴技术的规模化落地:
《云原生时代,如何加速建设运维技术保障体系》
《多云场景下的基础设施建设挑战与对策》
《趣丸可观测体系建设实践》
《趣丸AIOps探索与实践》
5、《转转一体化监控系统搭建实战》
6、《平安健康千亿级全链路追踪系统的建设与实践》
PPT下载:/s/1VxJY53L1DeQja0MRoFaevA#list/path=%2F