集群 对于不同的人有不同的含义。在本文的上下文中,集群最好定义为横向扩展(scale-out)—— 横向扩展集群一般包含大量相同类型的组件,比如 Web 场、表示场和高性能计......
这种 “集群的集群” 方式使懒惰的管理员设计的系统能够超过预期规模,支持集中的管理控制,同时不必担心大规模操作失败。
5. 在设计时就考虑到硬件的可管理性
许多管理员在设计集群时并没有考虑到 “可控制” 方面。高效的管理员都操作可控制集群,也就是说他们的集群放置在黑屋子中,远离工作人员,在理想情况下人们几周或几个月都不必看到他们每天操作的物理机器。在某些情况下,他们从来都没见过这些物理机器,因为他们是在世界的另一端管理它们。当然,最懒惰的管理员甚至不知道数据中心的具体位置 —— 对于他们来说,数据中心仅仅是一组主机名或 IP 地址。
数据中心噪音很大,有时候很冷,甚至可能有危险;懒惰的管理员应该尽可能避免到数据中心去。有人甚至认为呆在充满大量机器的房间里可能有对健康有害,尽管还没有发现这方面的证据。随着电力/制冷/人力成本的上升,越来越多的数据中心被转移到运营成本比较低的地方。因此,绝对的远程控制现在对于管理 Linux 集群越来越重要了,在不远的将来此功能可能是必需的。
硬件厂商非常重视客户对远程管理系统标准的需求。当前,IPMI 2.0 已经成为大多数 Linux 集群的标准。IPMI 提供了远程控制机器电源的方法,还提供远程控制台,可以观察计算机的 BIOS 引导过程。在我们的一位客户的站点上,我们能够坐在客户的办公室中,舒舒服服地对 60 英里外的计算机进行调试。(这位客户的 Linux 管理员真的很懒惰,他的办公室只用墙上昏暗的霓虹灯来照明。这间办公室简直成了单身汉的公寓,这里有两个冰箱,装满了饮料和甜食。不用说,我们不愿意离开那里)。
IPMI 是强大的 —— 我们可以修改 BIOS 设置,重新启动节点,观察它们的引导过程,查看屏幕转储,而根本不需要看到物理机器 —— 它应该安装在所有集群中。您至少需要以下功能:
●远程控制机器的电源 ●远程控制台或观察机器引导过程的更好方法,从而应付可能发生的引导问题 有了 IPMI,Linux 集群中就不太需要其他软件了,那些软件只提供运行 IPMI 的豪华界面,而不是管理节点。实际上,我们建议使用开放源码工具,比如大多数 Linux 发行版已经附带的 ipmitool。我们发现最懒惰的 Linux 集群管理员依赖于命令行。
5/14 首页 上一页 3 4 5 6 7 8 下一页 尾页 |