存储虚拟化作为实现云存储平台的一项基本技术,占有了不可或缺的技术地位。目前,随着世界各地的大型数据中心的不断涌现,存储虚拟化技术的应用更是受到广大存储用户的青睐。
存储虚拟化是通过在物理或虚拟服务器与现有物理存储之间创建虚拟抽象层来实现的。一旦执行了存储虚拟化,数据的物理位置就变得透明了。存储资源的供给可以跨越所有存储厂商的硬件,以相同的方式完成。存储可以进行分级,数据可以在分级存储中自动存储,同时,应用程序在不停机的情况下保证持续运行。
企业可以将存储空间用于其它的数据服务,如持续的保护与恢复等,从而帮助企业避免了由于构建用于灾难恢复的数据中心而带来的昂贵成本投入。以 Falconstor智能的存储虚拟化解决方案为例,它帮助用户整合了光纤、iSCSI、甚至InfiniBand的存储资源,并提供简单而集中的管理能力,通过Thin Provisioning及WAN优化复制等功能,帮助企业节约存储成本、高效利用存储资源,并为企业带来了经济高效的远程备份与恢复能力。
存储虚拟化技术以安全和优化的方式简化并共享数据。由于数据的物理位置不再那么重要(保证安全的前提下),一些通常由 IT 部门内部管理的功能可以轻松地由外部服务商来提供,企业的IT部门可以将工作重点放在更加核心的应用程序和功能上。
存储虚拟化与服务器虚拟化协同应用则为企业的CIO们带来了更强大的能量,高效、优化的IT架构,帮助企业降低成本的同时,也为企业带来了更为强大的数据服务,如资源供给、保护、复制及数据恢复。经过简化的IT架构在耗电、制冷、数据中心占地和持续运行方面都达到了绿色IT的要求。当所有这些结果都加在一起,我们的结论已经非常清晰:存储虚拟化对于企业数据中心整合非常重要。


到底存储虚拟化能为云存储平台的搭建带来怎样的效益呢?下面我们就来揭开存储虚拟化的面纱,看看它是如何打造高效可靠云存储平台的。
大幅度提高硬件资源的使用效率
存储虚拟化技术充分实现了存储资源的异构整合。每年设备淘汰更新换代都会造成大量硬件设备的浪费,而且高昂的新设备采购成本无疑也成为用户面临的难题。存储虚拟化整合异构平台,充分利用原有设备,解决了数据容量增长扩充、硬件升级时面临的成本限制问题,这一优势也越来越成为存储虚拟化技术被广泛青睐的核心因素之一。除此之外,存储虚拟化能实现将存储资源按需分配,合理利用数据存储空间,极大地提高了各种硬件系统资源的使用效率。同时,存储虚拟化可以提供数据分层存储,将不同读写速度的存储介质分为不同级别,比如,热点数据保存在存取速度快的物理设备中,这样就充分保障了硬件设备效率最大化。
大幅度简化系统管理的复杂度
不同厂商、不同架构的存储设备给设备管理人员带来很多不便,如今,云存储平台通过存储虚拟化技术,使整个系统平台管理变得更集中、更简单,减少管理人员的工作负担;同时,服务器、存储和网络的自动化操作也减少了大量的潜在的人为错误,保障了系统的可靠性。设备集中化和标准化不仅为客户减少不必要的麻烦,还为客户实际运行环境带来更多的价值,各种设备的配置管理、数据安全管理、业务连续性管理、容量管理、运行管理、性能管理等等都可以集中化。
大幅度增强云存储平台的可靠性
存储虚拟化不仅仅提供硬件资源的集中管理,还提供各种数据保护功能,实现业务的不间断运行。在实际应用中,很多时候在更换存储基础设施时,存储设备必须离线,否则会导致业务间断。而存储虚拟化技术可以允许故障设备在线更换,保障数据不间断读取。另外,传统的数据集中管理易造成设备I/O负载过重,并存在单点故障的危险,而在云存储平台下,可通过存储虚拟化实现I/O负载均衡,提高存储效率,降低设备性能的局限性。


从系统的观点看,有三种主要的存储虚拟化方法:

  
基于主机的虚拟存储;  
基于存储设备的虚拟存储;
基于网络的虚拟存储。
  
方法1:基于主机的虚拟存储
  
  基于主机的虚拟存储依靠于代理或治理软件,它们安装在一个或多个主机上,实现存储虚拟化的控制和治理。由于控制软件是运行在主机上,这就会占用主机的处理时间。因此,这种方法的可扩充性较差,实际运行的性能不是很好。基于主机的方法也有可能影响到系统的稳定性和安全性,由于有可能导致不经意间越权访问到受保护的数据。这种方法要求在主机上安装适当的控制软件,因此一个主机的故障可能影响整个SAN系统中数据的完整性。软件控制的存储虚拟化还可能由于不同存储厂商软硬件的差异而带来不必要的互操纵性开销,所以这种方法的灵活性也比较差。
  但是,由于不需要任何附加硬件,基于主机的虚拟化方法最容易实现,其设备本钱最低。使用这种方法的供给商趋向于成为存储治理领域的软件厂商,而且目前已经有成熟的软件产品。这些软件可以提供便于使用的图形接口,方便地用于SAN的治理和虚拟化,在主机和小型SAN结构中有着良好的负载平衡机制。从这个意义上看,基于主机的存储虚拟化是一种性价比不错的方法。


  
方法2:基于存储设备的虚拟化
  
  基于存储设备的存储虚拟化方法依靠于提供相关功能的存储模块。假如没有第三方的虚拟软件,基于存储的虚拟化经常只能提供一种不完全的存储虚拟化解决方案。对于包含多厂商存储设备的SAN存储系统,这种方法的运行效果并不是很好。依靠于存储供给商的功能模块将会在系统中排斥JBODS(JustaBunchofDisks,简单的硬盘组)和简单存储设备的使用,由于这些设备并没有提供存储虚拟化的功能。当然,利用这种方法意味着终极将锁定某一家单独的存储供给商。
  基于存储的虚拟化方法也有一些上风:在存储系统中这种方法较轻易实现,轻易和某个特定存储供给商的设备相协调,所以更轻易治理,同时它对用户或治理职员都是透明的。但是,我们必须留意到,由于缺乏足够的软件进行支持,这就使得解决方案更难以客户化(customzing)和监控。


  
方法3:基于网络的虚拟存储
  
  基于网络的虚拟化方法是在网络设备之间实现存储虚拟化功能,具体有下面几种方式:
  
  1.基于互联设备的虚拟化
  
  基于互联设备的方法假如是对称的,那么控制信息和数据走在同一条通道上;假如是不对称的,控制信息和数据走在不同的路径上。在对称的方式下,互联设备可能成为瓶颈,但是多重设备治理和负载平衡机制可以减缓瓶颈的矛盾。同时,多重设备治理环境中,当一个设备发生故障时,也比较轻易支持服务器实现故障接替。但是,这将产生多个SAN孤岛,由于一个设备仅控制与它所连接的存储系统。非对称式虚拟存储比对称式更具有可扩展性,由于数据和控制信息的路径是分离的。
  基于互联设备的虚拟化方法能够在专用服务器上运行,使用标准操纵系统,例如Windows、SunSolaris、Linux或供给商提供的操纵系统。这种方法运行在标准操纵系统中,具有基于主机方法的诸多上风--易使用、设备便宜。很多基于设备的虚拟化提供商也提供附加的功能模块来改善系统的整体性能,能够获得比标准操纵系统更好的性能和更完善的功能,但需要更高的硬件本钱。   
    但是,基于设备的方法也继续了基于主机虚拟化方法的一些缺陷,由于它仍然需要一个运行在主机上的代理软件或基于主机的适配器,任何主机的故障或不适当的主机配置都可能导致访问到不被保护的数据。同时,在异构操纵系统间的互操纵性仍然是一个题目。
  
  2.基于路由器的虚拟化
  
  基于路由器的方法是在路由器固件上实现存储虚拟化功能。供给商通常也提供运行在主机上的附加软件来进一步增强存储治理能力。在此方法中,路由器被放置于每个主机到存储网络的数据通道中,用来截取网络中任何一个从主机到存储系统的命令。由于路由器潜伏地为每一台主机服务,大多数控制模块存在于路由器的固件中,相对于基于主机和大多数基于互联设备的方法,这种方法的性能更好、效果更佳。由于不依靠于在每个主机上运行的代理服务器,这种方法比基于主机或基于设备的方法具有更好的安全性。当连接主机到存储网络的路由器出现故障时,仍然可能导致主机上的数据不能被访问。但是只有联结于故障路由器的主机才会受到影响,其他主机仍然可以通过其他路由器访问存储系统。路由器的冗余可以支持动态多路径,这也为上述故障题目提供了一个解决方法。由于路由器经常作为协议转换的桥梁,基于路由器的方法也可以在异构操纵系统和多供给商存储环境之间提供互操纵性。


  
谁能胜出?
  

  每一种方法都有其优缺点。对比如下图所示:


  
  基于主机和基于存储的方法对于初期的采用者来说魅力最大,由于他们不需要任何附加硬件,但对于异构存储系统和操纵系统而言,系统的运行效果并不是很好。对于那些要求最大限度进行互操纵的企业来说,基于交换机或基于路由器的方法可能更为恰当。对那些要求更高可扩充性的用户来说,基于路由器的方法是最优选择。基于互联设备的方法处于两者之间,它回避了一些安全性题目,存储虚拟化的功能较强,能减轻单一主机的负载,同时可获得很好的可扩充性。  
  不同供给商的存储虚拟化实现方法不同,一些偏重于复制,一些擅长备份,而另外一些在恢复和访问控制方面性能更为优越。存储治理软件供给商趋向于提供最完善的治理套餐。但是,多平台的支持和最佳的性能特性并不轻易达到最优。
  在数据复制方面已经发展出多种镜像方法。很多存储供给商提供三层镜像结构,Veritas公司甚至能够提供四层镜像结构。镜像在一些方面受到推崇,全面镜像能在另一个驱动器上产生完全相同的副本。这个附加的副本有时也称为快照,只存储以前版本的数据。有时,在不同地理位置上存在的副本驱动器,通过IP相连能产生远程或异步副本。
  在存储网络中,存储访问控制经常在分区(Zoning)式的主机和存储系统中进行。只有属于同一个分区的主性能够访问这个分区的存储设备。主机和存储设备经常是多分区的一员。分区制的理念与虚拟专用存储网络相似。
  分区有多种方法。随着共享存储的粒度和治理难易程度不同,分区方法的差异很大。基于端口的分区经常在交换机中实现,交换机内部的访问必须在指定的端口之间进行。这种分区的特色是分区之间不能重叠。当指定的端口分区成员发生变动时,分区需要重新配置。这种方式有着明显的缺陷,由于大多数情况下,即使交换机端口发生调整,也不答应改变分区成员的一致性。
  子系统分区或卷映射经常由内部磁盘子系统的控制器来实现,它答应整个或部分驱动器成为其数据出口,使得单一存储子系统看起来似乎是多驱动器和多主机。基于逻辑单元设备号掩码(LUNmasking)之上的分区在主机I/O控制器、主机软件或路由器上得以实现。LUN掩码像一个过滤器,只答应主机访问特定的存储资源,它也答应一个存储子系统中单一驱动器能够属于不同的分区,从而产生设备层面的分区。
  存储虚拟化功能的复杂性很轻易在很多供给商中产生一种"人人都能做虚拟化"的错觉,实在是各商家采取了不同的标准来定义"虚拟化"。供给商之间技术的整合和合作随时都可能发生。因此要求数据中心经理们具备良好的技术知识,以便清楚地了解自己需要的是什么。
Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐