现状:Hotmail目前拥有遍及全球的一万多台服务器,每天处理数十亿的电子邮件事务,存储量数千兆兆(PB),总共聘用不到100名系统管理员进行管理工作。
在增加服务器数量的同时保持管理人员人数不变,即可管理性也是一项挑战。
数据移植需要考虑复杂的性能规划、数据中心空间以及能源消耗问题。
自行构建的管理工具包括部署、度量标准收集、赁单记录、故障跟踪、代码覆盖、监控、编目、故障检测和构建系统。
许多应用程序都受到I/O的限制而非磁盘的限制,如何平衡I/O与数据的关系是非常困难的。指望磁盘性能向上扩展可能会失败,应该依靠的是向外扩展。
处理一个产品模型时,必须假设一切都会出错,那么就必须处理这些故障,所有数据都必须有副本,而系统必须能够自愈。
现在有许多生产力工具可使工程师的工作更为简单,因为您可以免费获得服务。但那些服务本身可能不是最有效率的。因此在规模较小的应用程序中,您可以通过 这样的服务侥幸获得成功。但在超大规模的服务内,一切都要从头构建并加以优化以降低成本,因为与运营成本相比,研发工作只不过是小问题。
使所有的部件都保持简单,就是设计超大型服务的关键所在。
磁带备份的概念已不再可行。构建能够备份更改--将它们备份到便宜的磁盘中--的系统或许是我们的方向。
我们的操作小组从不希望信赖任何类型的用户界面。一切都必须是可通过脚本编写的、必须是可通过某种类型的命令行运行的。惟有通过这样的方式,才能够执行脚本,并收集来自上千台机器的结果。
尽量保持所有的东西一致,包括部署、应用程序、错误和警报信息。因为所有的东西都是一致的,所以需要增扩的操作人员少之又少。
在构建一种能够简便地进行管理的系统--特别是将来可能会大规模扩展的系统--时,其“咒语”就是自动化。
相关文章
- DEVOPS 运维开发系列一:ITIL服务目录管理流程的设计与信息化管理系统功能的开发
- 青岛港:服务器虚拟化和动环的一体化运维管理
- 运维网络管理人员常备的系统工具|服务器工具
- Linux centosVMware 自动化运维Ansible介绍、Ansible安装、远程执行命令、拷贝文件或者目录、远程执行脚本、管理任务计划、安装rpm包/管理服务、 playbook的使用、 playbook中的循环、 playbook中的条件判断、 playbook中的handlers、playbook实战-nginx安装、管理配置文件
- Hotmail运维:管理超大型服务的挑战
- 运维程序】简单的命令控制器(支持定时命令执行、重复定时任务命令和进程管理,开发这个小程序主要是为了方便管理服务进程)【个人github项目】
- 网易蜂巢的容器运维管理服务使用指南
- 请问从运维的角度怎样管理windows服务器比较好呢?
- Hotmail运维:管理超大型服务的挑战