互联网运营智慧——高可用可扩展网站技术实战
查看您的阅读历史
- 类别:
- 基础信息化
- 互联网运维是一门系统化的学问,也是一门新兴学科,书店里也很难找到一本能全面介绍运维体系的书籍,这是本书创作的初衷。本书深入浅出地介绍运维架构中的各个节点,从网络规划到服务器安装到负载均衡、分布式文件系统等架构规划,无一不囊括,包括:从简要说明选择开源技术作为运营环境开篇,到选定平台及工具的部署实施,以实例展示如何使用开源工具,来实现用户访问量在1000万这样的一个级别的站点功能。在本书中,也穿插了一些非技术方面的描述,如在系统运营中,有哪些日常事务、服务扩展该怎么着手,以及在运营中有哪些策略及技巧等。本书加入了作者的思想、经验、教训及建议等,尽可能使用类比方式来说明一些复杂且不易理解的东西,同时增强文章的可读性和趣味性。
10云计算之Hadoop
- 第一节 Hadoop概述
- 第二节 Hadoop项目状况
- 第三节 部署Hadoop
- 第四节 Hadoop部署Hive
- 第五节 部署Hadoop桌面工具Cloudera-desktop
- 第六节 Hadoop应用实例
- 第七节 Hadoop杂项
11网关服务
- 第一节 内部网络出口网关
- 第二节 VPN网关
- 第三节 GRE隧道服务
- 第四节 VPN及GRE隧道安全问题
12监控系统Nagios
俗话说:工欲善其事,必先利其器。要做好系统管理,使自己的工作更轻松、更有效的话,一个好的监控工具是必不可少的。
在2002年的时候,我有幸承包中国科学院某研究所的整个网络维护。当时网络状况十分糟糕,断网情况比较频繁。造成这种情况的原因大致有以下两种。
*内部网络联网混乱。
*上联到另外一个研究所,那里时不时操作不慎把上连的线路给弄掉了。
为了了解网络是否处于一个可用的状态,我上班的第一件事情就是打开网络收音机,根据声音的有无进行判断。
再往后两年,有一些用于远程教育的服务器托管在亦庄某机房。这个机房的服务的实在是很糟糕,曾有一段时间,网络服务基本处于无法访问的状态,打电话过去,那边敷衍说机房受到攻击,马上就会正常。我们不得不暂时相信他的托词,为了知道何时网络能恢复正常,我就在办公室的电脑执行ping服务器IP地址的操作。
2005年秋天,我在一个SP公司做系统管理。这里有数百个服务器对外提供服务,并且要求24小时运营保障。这种网络环境下,再用听在线收音机或者ping来判断网络是否正常,是没有什么效果的。幸好,在我接手的时候,已经有了一个监控系统Netsaint(Nagios的早期版本名称),后来我把它升级成最新的Nagios。通过逐步完善这个监控平台,取得比较理想的运营效果:只需带着手机,有故障会自动发短信报警。
- 第一节 Nagios概述
- 第二节 Nagios监控场景描述
- 第三节 Nagios服务器的自我监控实现
- 第四节 Nagios监控MySQL服务器
- 第五节 Nagios监控MySQL主从复制
- 第六节 Nagios监控其他服务器
- 第七节 监控错误日志实例
- 第八节 使用脚本部署NRPE
- 第九节 Nagios故障处理汇集
- 第一十零节 Nagios监控策略
13高可用、可扩展、负载均衡解决方案的设计与实践
- 第一节 高考中国网现行的运行架构
- 第二节 功能需求
- 第三节 方案选择
- 第四节 高可用、可扩展、负载均衡解决方案的设计
- 第五节 部件/工具的选择
- 第六节 辅助功能——监控系统的设计
- 第七节 高可用、可扩展、负载均衡总体架构的技术实现
- 第八节 方案实施后的效果