出差半月了,终于项目要测试上线了,心里无比激动。在项目中遇到了不少困难,当然学到了不少东西。经历了一个项目,很多幸酸和痛苦,当然也有一定的成就感。

Vmware esxi 5.0集群高可用不得不说的2个高可用功能ha和drs。这两个功能确保了vmware虚拟机的正常运行,而不至于一台主机down机而业务中断。而且资源能够动态平衡,功耗节约方面做的很好。vmware成为当今虚拟化老大还是有一定的技术含量的,不是轻而易举能够被取代的。

我们在安装集群的时候选择ha和drs两个选项,如图:


一、HA功能介绍

在我看来ha功能就是减少中断业务,和停机时间。在发生故障时他能够快速的迁移到其他主机,这个功能不得不说对于业务的重要性。

当然我们在之前要考虑很多东西,比如单点故障,pdu冗余,交换机冗余,网卡绑定冗余,存储光端机冗余等等。只有严谨的架构设计才能保证真正的高可用。

当然官方有官方的说法,差不多一样。下面是官方的说法,

与传统的故障切换解决方案相比,vSphere HA 具有多个优势:

最小化设置设置 vSphere HA 群集之后,群集内的所有虚拟机无需额外配置即可获得故障

切换支持。

减少了硬件成本和设置虚拟机可充当应用程序的移动容器,可在主机之间移动。管理员会避免在多台

计算机上进行重复配置。使用 vSphere HA 时,必须拥有足够的资源来对要通

过 vSphere HA 保护的主机数进行故障切换。但是,vCenter Server 系统会自

动管理资源并配置群集。

提高了应用程序的可用性虚拟机内运行的任何应用程序的可用性变得更高。虚拟机可以从硬件故障中恢

复,提高了在引导周期内启动的所有应用程序的可用性,而且没有额外的计算

需求,即使该应用程序本身不是群集应用程序也一样。通过监控和响应 VMware

Tools 检测信号并重新启动未响应的虚拟机,可防止客户机操作系统崩溃。

DRS 和 vMotion 集成如果主机发生了故障,并且在其他主机上重新启动了虚拟机,则 DRS 会提出迁

移建议或迁移虚拟机以平衡资源分配。如果迁移的源主机和/或目标主机发生故

障,则 vSphere HA 会帮助从该故障中恢复。


二、下面是一些设置请大家参考:

由于我们项目上的服务器资源很大,内存单台有128g,80核vcpu,这里保留15%。这个按照实际需求来设置。

Ha设置比较简单,其他的不用过多设置,ha就可以保证在故障是能2-5分钟迁移虚拟机到别的主机。(还是要考虑vmotion的带宽情况,如果虚拟机过多,最好把vmotion设置为多网卡绑定,如下图:我的vmkernel没有在截图中。)


Ha还有一个功能叫做ft,容错,这个功能设计的很好,但是目前vmware官方也承认是鸡肋,功能还不是很成熟,ft这个功能就是可以保证在发生故障时,能够保证秒级别不断线。只有开启了ha才能开启ft。(很可惜的是目前ft只支持1 vcpu)

在虚拟机上--右键—开启ft功能(我测试过这个功能,丢一个ping包)


三、Ha的测试方法:

1、  我们是两个交换机,可以把其中一台交换机的电断掉。

2、  可以断掉一台主机的业务网线

3、  可以开维护模式

注意:当故障发生时,发生ha,这里不是迁移,而是虚拟机重启,重新注册到另外一台机器的过程。

      

database群:119224876(db china联盟) 虚拟化方面群:229845401(虚拟化-云计算-物联网)

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐