集群内机器重启

    在云计算环境下,一个集群代表一堆机器组成的机器组,一般由一个admingateway打通通道(ssh安全通道)到该集群中的其他机器。
    集群里面的机器经常会出现问题,然后就会导致admingateway不能ssh到坏的机器,这个时候重启机器就会有两种方式:
    1.    能够ssh到那台机器,直接sudo reboot。
    2.    不能ssh到那台机器,那么就需要进行带外重启。

 带外管理是新一代网络管理技术的简称。网络管理又分为带内管理(In-Band)和带外管理(Out-Of-Band)。目前我们使用的网络管理手段基本 上都是带内管理,即管理控制信息与数据信息使用统一物理通道进行传送。例如:我们常用的HP Openview网络管理软件就是典型的带内管理系统,数据信息和管理信息都是通过网络设备以太网端口进行传送。带内管理的最大缺陷在于:当网络出现故障 中断时数据传输和管理都无法正常进行。带外管理的核心理念在于通过不同的物理通道传送管理控制信息和数据信息,两者完全独立,互不影响。 

 由此看来,一个现代化的机房,带外管理设备是必不可少的,否则将会耗费巨大的人力物力来管理机房,特别是在一些紧急情况下可以大大加强对机房的控制力。


Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐