这是小米系统运维部在阿里嘉年华的分享slide:)
主要分享了小米运维平台和监控,在成长过程中的思考,实践和现状
大纲:
– 服务树:基于标签的服务树设计
– 运维平台
– 监控
* 服务和监控一体化
* 小米目前的服务监控现状
* zabbix的部署结构,使用经验和扩展
PDF下载:
View Fullscreen
7,613 浏览
这是小米系统运维部在阿里嘉年华的分享slide:)
主要分享了小米运维平台和监控,在成长过程中的思考,实践和现状
大纲:
– 服务树:基于标签的服务树设计
– 运维平台
– 监控
* 服务和监控一体化
* 小米目前的服务监控现状
* zabbix的部署结构,使用经验和扩展
PDF下载:
View Fullscreen
16 Comments
没细讲perfcount啊……楼主没干货,哈哈
perf-counter 就是给 trapper 发送数据吗?
发送的数据是直接用的 zabbix sender 的协议还是前面挂了一层?
不是,另外的一套东西,后续会分享和开源出来
呃 完全木有讲部署
恩,这次主要分享的服务树和监控,下次介绍部署:)
邀请来分享下
管饭就去
来我团分享下,管饭。(:
哈,谢谢支持:)
能介绍下服务树如何与周边系统关联吗?
看完了slide,整体架构思路和我们两年前的版本很像,偏向基础性能指标监控。大胆猜zabbix自身的集群还不够大,管的机器还不够多:)
小公司,小规模,微团队,不过我们一点一点再追赶:)
“Alexser
2013/07/21 at 10:17 下午
能介绍下服务树如何与周边系统关联吗?”
同问!
根据服务树关联机器,通过机器进行部署、监控、权限管理……
请教一下你们报警去重及合并是怎么实现的?
请教下,服务树是怎么实现的,服务树的表结构是怎样的?