vCenter 双机热备
资料来源:https://www.zhihu.com/pub/book/119650679概念FT(FauItToIerance,容错)可理解为vSphere环境下虚拟机的双机热备。FT高纟及特性是VMwarevSphere虚拟化架构中一个非常让人激动的功能。使用HA可以实现虚拟机高可用,但虚拟机重新启动的时间不可控,而使用FT就可以避免此问题。因为FT相当于虚拟机的双机热,它以主...
资料来源:
https://www.zhihu.com/pub/book/119650679概念
FT(FauItToIerance,容错)可理解为vSphere环境下虚拟机的双机热备。FT高纟及特性是VMwarevSphere虚拟化架构中一个非常让人激动的功能。使用HA可以实现虚拟机高可用,但虚拟机重新启动的时间不可控,而使用FT就可以避免此问题。因为FT相当于虚拟机的双机热,它以主从方式同时运行在两台ESXi主机上,如果主虚拟机的ESXi主机发生故障,在另一台ESXi主机上运行的从虚拟机立即接替它的工作,应用服务不会出现田可中断。和HA相比,FT更具优势,它几乎将故障的停止时间降到了零。特别是VMwarevSphere6.7的以机最多可以使用8个vCPU,极大地增加了FT在生产环境中的实用性。
VMwarevSphere5.×中的FT使用vLockstep技术来实现容错,其本质是录制/播放功能。当虚拟机启用FT后,虚拟机一主一从同时在两台ESXi主机上运行,主虚拟机做的任何操亻乍都会立即通过录制播放的方式传递到从虚拟机,也就是说两台虚拟机所有的操作都是相同的。但由于采用的是录制/播放的方式,主从虚拟机间会存在一定的时间差(但基本可以忽略),这个时间差称为vLocksteplnterval,其大小取决于ESXi主机的整体性能。当主虚拟机所在的ESXi主机发生故障时,从虚拟机立即接替工作,同时提升为主虚拟机,接替的时间在目舜间完成,用户几乎感觉不到后台虚拟机
VMwarevSphere6.7中的FT使用新的FastCheckpointing技术来实现容错,取代了5.x版本中的vLockstep技术。使用FastCheckpointing技术、IOGE以及分开的VMDK文件,可以让虚拟机在两台ESXi主机上高效地运行。
VMwarevSphere虚拟化架构中的FT技术通过创建和维护与某类虚拟机相同且可在进行故障切换时随时替换此类虚拟机的其他虚拟机,来确保此类虚拟机的连续可用性。受保扌户的虚扌以机称为主虚拟机,另外一台虚拟机称为从虚拟机,也可称为辅助虚拟机,在其他主机上创建和运行。由于辅助虚拟机与主虚拟机的执行方式相同,并且辅助虚拟机可以无中断地接管任何点处的扌丸行任务,因此可以提亻共容错保扌户。主虚扌蚶囗辅助虚拟机会持续监控彼此的状态以确保维护FTO如果运行主虚拟机的ESXi主机发生故障,系统将会执行透明故障切换,此时会立即启用辅助虚拟机以替换主虚拟机,并启动新的辅助虚拟机,自动重新建立FT冗余。如果运行辅助虚拟机的主机发生故障,则该主机也会立即被替换。在任何情况下,都不会出现服务中断或娄划居丢失的情况。主虚拟忄囗辅助虚拟机不能在相同的ESXi主机上运行,此阝艮制用来确保ESXi主机故障不会导致两个虚拟机都丢失。
VMwarevSphere6.7中FT具有新的特性,其具体表现在:·支持虚拟机最多8个vCPlJ以及最大64GB内存;·取代老版本中的vLockstep技术、采用全新的FastCheckpointing技术;·使用FastCheckpointing监控网络带宽,检验点的传输时间间隔很短(2毫秒一500毫秒);·FauItToIeranceLogging支持亻吏用IOGE传输。
FT不支持的vSphere功能
FT提供了最大眼度的虚拟机容错,但是由于其自身原因,FT不支持某些vSphere功能,如下所示。
- 快照。FT不支持虚拟机快照,在虚拟机启用FT前,必须移除或提交快照,同时不能对已启用FT的虚拟机执行快照。
- Storage vMotio已启用FT的虚拟机不支持Storage vMotion 如果必须使用StoragevMotion,应当暂时关闭FT,然后执行StoragevMotion操作,执行兀成后再新打开FTO
- ·链接复制〔软件中的叫法为「链接克隆」〕。链接复制的虚拟枧不支持使用FT,也不能从启用了FT的虚拟机中创建链接复制。
- VirtualSANO早的VMwarevSphere版本中vSAN不能使用FT,啹VMware言方发布的消息VMwarevSphere65后的版本支持在vSAN上使用FT。
- 虚拟机组件保护。如果群集已启用虚拟机组件保护,则会为关闭此功能的容错虚拟机创建替代项。
- 基于VVOL的数据存储。
- 基于存储的策略管理。
- I/O筛选器。
配置
Step1: 检测ESCI主机是否开启FT日志记录。
Step2: 不建议使用1G网络适配器运行FT,建议使用独立的10GE网络适配器运行FT。
Step3:创建新的VMkernel网络适配器运行FT。
Step3:配置完成,其他ESXI 主机也创建独立的标准交换机运行FT。
Step4:选择要运行FT的虚拟主机。
Step5:出现故障提示信息,根据故障提示信息解决问题。
Step6:配置虚拟机的FT功能。存储尽量选择不同的存储。
Step7:配置完成后,系统创建辅助虚机。
Step8:配置完成
至此,虚拟机FT配置完成。整体来说,FT的配置难度不大。FT与HA最大的区别在于FT不需要重新启动虚拟机,出现故障后辅助虚拟机直接被提升为主虚拟机,不间断对外提供服务。需要注意的是,如果主虚拟机出现蓝屏的情况,辅助虚拟机同样会出现蓝屏。
1.生产环境中使用vMotion的注意事项
(1)在生产环境中推荐使用专用的网卡运行vMotion流量,特别注意iSCSl,应尽量避免,与vMotion一起运行。
(2)生产环境中不要同时迁移过多的虚拟机,因为这样可能会影响虚拟化架构的整体运行,可以参考前面章节中1GE、10GE并发迁移虚拟机的数量。
(3)生产环境中所有ESXi主机要配置好目标网络,以避免出现迁移完成后虚拟机网络无法使用的情况。
(4)对于虚拟机存储的迁移,受虚拟机容量、网络、存储服务器等因素的影响,其迁移速度不可控。
(5)对于跨存储迁移,比如从iSCSl存储迁移到FC存储,一定要先做好评估,建议在服务器访问量小的时候进行,这样整体影响较小,迁移过程中不会出现在太多的问题。
2.生产环境如何选择HA接入控制策略
应当基于可用性需求和群集的特选择vSphereHA接入控制策略。选择接入控制策略时,应当考虑的因素很多。
(1)选择什么样的接入控制策略
在生产环境中,比较常见的是选择按静态主机数量定义故障切换容量、预留一定百分比的群集资源来定义故障切换容量这两种策略。若选择前者,当群集中某一台虚拟机所需的CPU或内存资源较大,而其他虚拟机所需的CPU或内存资源比较平均时,会影响到ESXi主机支持的插槽数量。因此,如果群集中虚拟机所需的CPU和内存资源差距较大,推荐使用后者,而不使用前者。
(2)避免资源碎片
当群集有足够资源用于虚拟机故障切换时,将出现资源碎片。但是,这些资源位于多个主机上并且不可用,因为虚拟机一次只能在一个ESXi主机上运行。用户可以丬蚕槽定义为虚拟机最大预留值,配置「群集允许的主机故障数目」策略避免资源碎片。「群集资源的百分比」策略不解决资源碎片问题。「指定故阝章切换主机」策略不会出现资源碎片,因为该策略会为故障切换预留主机。
(3)故障切换资源预留的灵活性
为故障切换保护预留群集资源时,接入控制策略所提供的控制力度会有所不同。「群集允许的主机故障数目」策略允许设置多个主机用于故障切换。「群集资源的百分比」策略最多允许指定100%的群集CPU资源或内存用于故障切换。通过「指定故障切换主机」策略可以指定一组故障切换主机。
(4)群集的异构性
从虚拟机资源预留和主机总资源的容量方面而言,群集可以异构。在异构群集内,「群集允许的主机故障数目」策略可能过于保守,因为在定义捶槽大小时它仅考虑最大虚拟机预留,而在计算当前故障切换容量时也只假设最大主机发生故障数。其他两个接入控制策略不受群集异构性影响。
3.生产环境中虚拟机FT的注意事顶
(1)VMwarevSphere6.7提高了对vCPlJ的支持数量,最多可以支持8个vCPU,这已经能够满足大多数生产环境中虚拟机的基本需求,但需要注意,不同VMwarevSphere版本的支持存在差异。
(2)在生产环境中使用FT,强烈推荐使用专用的10GE承载FT,在1GE下使用会出现警告提示。同时,也建议使用不同的存储来存放虚拟机文件,避免主、从虚拟机使用相同的存储。(3)在生产环境中使用FT,可以结合HA等其他高级特性,同时也需要注意一个问题,比如Windows操作系统中常见的蓝屏,如果主虚拟机出现蓝屏的情况,辅助虚拟机同样会出现蓝屏。
(4)从技术角度上来看,FT整体来说不错,一些虚拟机使用了程序本身自带的冗余技术从而可以不考虑使用FT,但是,对于一些虚拟机没有使用程序本身的冗余而又要求高可用时,FT就比较实用,但需要注意vCPU是否支持。
更多推荐
所有评论(0)