Linux下高可用集群方案很多,本文介绍的是性价比比较高的一种: 使用Heartbeat 2.0配置Linux高可用性集群。一、 准备工作你首先需要两台电脑,这两台电脑并不需要有相......
硬件watchdog比软件watchdog有更好的可靠性。 软件watchdog基于内核的定时器实现,当内核或中断出现异常时,软件watchdog将会失效。而硬件watchdog由自身的硬件电路控制, 独立于内核。无论当前系统状态如何,硬件watchdog在设定的时间间隔内没有被执行写操作,仍会重新启动系统。
一些硬件watchdog卡如WDT501P 以及一些Berkshire卡还可以监测系统温度,提供了 /dev/temperature接口。 对于应用程序而言, 操作软件、硬件watchdog的方式基本相同:打开设备/dev/watchdog, 在重启时间间隔内对/dev/watchdog执行写操作。即软件、硬件watchdog对应用程序而言基本是透明的。
在任一时刻, 只能有一个watchdog驱动模块被加载,管理/dev/watchdog 设备节点。如果系统没有硬件watchdog电路,可以加载软件watchdog驱动softdog.ko。
3 Linux内核中关于watchdog的配置
在/usr/src/linux目录运行命令:makemenu config 确保在下面的菜单已经启用Software Watchdog选项
Character Devices Watchdog Cards ---> [*] Watchdog Timer Support [M] Software Watchdog (NEW) |
如图2 。

图 2 编译内核支持Software Watchdog选项
4 加载模块
#insmod softdog
说明:watchdog能让系统在出现故障1分钟后重启该机器。这个功能可以帮助服务器在确实停止心跳后能够重新恢复心跳。 如果使用该特性,则在内核中装入"softdog"内核模块,用来生成实际的设备文件,输入"insmod softdog"加载模块。 输入"grep misc /proc/devices"(应为10),输入"cat /proc/misc | grep watchdog"(应为130)。 生成设备文件:"mknod /dev/watchdog c 10 130" 。
5 测试软件狗
编辑文件 /etc/ha.d/ha.cf 如掉下面一行的注释号: watchdog /dev/watchdog 重新启动Heartbeat #service heartbeat restart 使用命令杀掉heartbeat进程 killall -9 heartbeat 此时日志文件中应当出现一行: Softdog: WDT device closed unexpectedly. WDT will not stop!
9/13 首页 上一页 7 8 9 10 11 12 下一页 尾页 |