海量运维、运营规划之路

作者以质量、效率、成本为核心,与大家分享的心得涵盖运维的方方面面,架构规划、监控报警、变更、安全、运维平台等,让我们一起走进运营规划师的世界。本文更像是一本书的开篇前言和目录索引,大家可以点击各小节的标题链接在原文网站展开阅读。


本文转载自itkoala.com 2013-03-18

Index

----------------------------------------------------------------------------------------------------------------------

关于海量运维、运营规划,我想业界都没有准确的定义,假如说互联网的架构师用能否设计多高的摩天大楼来衡量架构能力,那运维、运营更多的是在关注互联网服务的质量、效率、成本、故障、瓶颈,用户的忍耐、抱怨等问题。

在接下来的日子里,将以质量、效率、成本为核心,从运营规划、管理、流程/规范、系统/平台,监控、告警、安全、优化、考核等几个维度结合案例来与大家分享自己的体会,内容大致如下所示。

index011

*前言*

----------------------------------------------------------------------------------------------------------------------

痛并快乐着

关于运营规划师

*质量*

----------------------------------------------------------------------------------------------------------------------

规划篇

1. 架构规划

1.1 新趋势、新机遇、新挑战

1.2 产品、架构、成本生命周期

1.3 质量、速度、成本

1.4 专业化、平台化、持续化

1.5 可伸缩、可调度、可扩展

1.6 Set模型,集装箱改变世界

1.7 全网调度,速度与容灾并进

1.8 监控与告警,远航的指路明灯

1.9 海量导致架构取向,适用是王道

1.10 可扩展、可持续架构的思考

2. IDC规划

2.1 全球最复杂的基础网络

2.2 IDC属性、瓶颈分析及建议

2.3 IDC策略,分布致胜、速度第一

3. CDN规划

3.1 CDN发展现状与趋势分析

3.2 CDN厂商分析及外包细节

3.3 CDN节点分布及解析策略

3.4 CDN外包质量和风险控制

4. 预算规划

4.2 预算的作用及预算推导

4.3 服务器定制,切合应用与性价比

4.4 服务器需求,用数据说话

速度篇

1. 网站速度优化介绍

1.1 什么是网站速度优化

1.2 网站速度优化的价值

1.3 网站速度关键指标

1.4 影响网站速度的因素

2. 网站速度监测实践

2.1 网站速度检测概述

2.2 网站速度主动监测

2.3 网站速度被动监测

3. 网站速度分析实践

3.1 网站速度分析概述

3.2 网站速度分析工具

3.3 网站速度分析案例

4. 网站速度优化实践

4.1 速度优化概述

4.2 网络速度优化及案例

4.3 系统速度优化及案例

4.4 前端速度优化及案例

5. 防止网站速度退化

6.1 通过规范防止速度退化

6.2 通过工具防止速度退化

监控篇

1. 监控规划

1.1 质量监控,质量监控的作用

1.2 设备监控,设备运行状态可视化

1.3 网络监控,时刻掌握网络变化

1.4 域名监控,如何做精准DNS解析

1.5 URL监控,实时网页访问状态

1.6 缓存监控,多缓存监控的方法

1.7 DB监控,数据库监测可视化

1.8 应用监控,动态应用模块间监控

1.9 访问监控,获取用户访问速度

1.10 响应监控,IDC内服务响应监控

1.11 内容监控,掌握网站各元素变化

2. 周报报表

2.1 综合周报,自动化的综合周报

2.2 业务周报,定制化的业务周报

告警篇

1. 统一告警,如何具备千里眼、顺风耳

2. 告警分级,将告警分类区分对待

3. 告警模型,如何建立告警模型

4. 告警收敛,规避被告警淹没

5. 告警关联,1+1>2,让告警更具价值

6. 告警分析,用数据说话

安全篇

1. 漏洞扫描

2. 域名劫持扫描

3. 挂马扫描

4. CGI扫描

5. 网页篡改扫描

*效率*

----------------------------------------------------------------------------------------------------------------------

管理篇

1. 配置管理,将所有资源标识并记录在册

2. 事件管理,记录、分类、诊断、解决问题

3. 问题管理,消除引起问题的根本原因

4. 变更管理,串联变更原因、过程、结果

5. 容量管理,对运营指标未来的量化、预测

6. 关于事件、问题、告警管理的一些体会

平台篇

1. 静态资源平台

2. 动态应用平台

3. 数据库托管平台

4. 逻辑服务平台

5. 缓存管理平台

6. 自动发布平台

7. 海量存储平台

8. PGV点击流平台

9. GSLB全网调度平台

流程篇

1. 环境一致性规范

2. 发布、变更规范

3. 运营故障分级和处罚规范

4. 运营资源申请流程

5. 预算管理规范

6. IDC变更流程

7. CDN运营规范

考核篇

1. 运营质量考核

2. 架构能力考核

3. 运营预算考核

*成本*

----------------------------------------------------------------------------------------------------------------------

带宽篇

1. 规模化导致带宽成为最大成本

2. 通过改变产品形态减少数百万成本

3. 带宽成本量化及可持续跟踪

硬件篇

1. 服务器分类、分级、分层定制

2. 按应用场景使用虚拟化服务器

3. IDC专区化,合适使用网络设备

还没有评论,快来抢沙发!

发表评论

  • 😉
  • 😐
  • 😡
  • 😈
  • 🙂
  • 😯
  • 🙁
  • 🙄
  • 😛
  • 😳
  • 😮
  • emoji-mrgree
  • 😆
  • 💡
  • 😀
  • 👿
  • 😥
  • 😎
  • ➡
  • 😕
  • ❓
  • ❗
  • 67 queries in 0.431 seconds