NoOps

Ops make no ops | Ops的目标是没有Ops,嗯!

ADC2013 之 小米运维平台和监控

作者: |   5,330 浏览  | 

这是小米系统运维部在阿里嘉年华的分享slide:)

主要分享了小米运维平台和监控,在成长过程中的思考,实践和现状

大纲:

– 服务树:基于标签的服务树设计
– 运维平台
– 监控
* 服务和监控一体化
* 小米目前的服务监控现状
* zabbix的部署结构,使用经验和扩展

PDF下载:

View Fullscreen

16 Comments

  1. wilbur
    2013/07/17 at 10:42 上午

    没细讲perfcount啊……楼主没干货,哈哈

  2. nomyself
    2013/07/17 at 4:10 下午

    perf-counter 就是给 trapper 发送数据吗?

    发送的数据是直接用的 zabbix sender 的协议还是前面挂了一层?

    • wilbur
      2013/08/22 at 10:18 下午

      不是,另外的一套东西,后续会分享和开源出来

  3. Foo
    2013/07/17 at 4:33 下午

    呃 完全木有讲部署

    • wilbur
      2013/07/17 at 5:56 下午

      恩,这次主要分享的服务树和监控,下次介绍部署:)

  4. zixi
    2013/07/18 at 6:33 下午

    邀请来分享下

    • wilbur
      2013/07/19 at 6:06 下午

      管饭就去

      • nomyself
        2013/07/21 at 10:57 上午

        来我团分享下,管饭。(:

        • 2013/07/21 at 5:45 下午

          哈,谢谢支持:)

  5. Alexser
    2013/07/21 at 10:17 下午

    能介绍下服务树如何与周边系统关联吗?

  6. Atom
    2013/08/12 at 10:40 下午

    看完了slide,整体架构思路和我们两年前的版本很像,偏向基础性能指标监控。大胆猜zabbix自身的集群还不够大,管的机器还不够多:)

    • wilbur
      2013/08/13 at 11:54 上午

      小公司,小规模,微团队,不过我们一点一点再追赶:)

  7. netcomm
    2013/08/23 at 8:38 上午

    “Alexser
    2013/07/21 at 10:17 下午
    能介绍下服务树如何与周边系统关联吗?”
    同问!

    • wilbur
      2013/08/24 at 8:59 上午

      根据服务树关联机器,通过机器进行部署、监控、权限管理……

  8. water
    2013/10/14 at 4:04 下午

    请教一下你们报警去重及合并是怎么实现的?

  9. water
    2014/10/20 at 4:30 下午

    请教下,服务树是怎么实现的,服务树的表结构是怎样的?

发表评论