当前位置:首页 > 虚拟化 > 正文

什么是传统存储虚拟化架构


一、大数据存储方式有哪些

存储大数据的方法有分布式存储、存储虚拟化等。

分布式存储是一种容错、高吞吐量的数据存储方式,支持批量处理,适用于大规模数据分析问题。分布式文件系统可以存储和管理多个文件,并通过集中存储和分布式文件系统提供高吞吐量的数据访问。分布式系统由多个自治处理单元组成,这些处理单元通过计算机网络互连并共同完成分配的任务。

分布式存储系统可以提供比传统集中式存储更大的灵活性,但必须考虑数据分布和数据冗余问题。存储虚拟化是一种大数据存储解决方案,通过自动精简配置和存储资源池共享来减少闲置和浪费的存储空间。

大数据存储意味着什么?

大数据有多种含义,描述了组织的规模,但更重要的是,它是关于定义的。在公司内部构建IT基础设施。业界对大数据应用有着无尽的期待,商业信息积累得越多,价值就越大。

随着大数据应用的爆发式增长,公司衍生出了自己的架构,直接驱动存储、网络、计算技术的发展。毕竟,处理大数据有特殊的需求。是一个新的挑战。在这个例子中,硬件开发最终是由软件需求驱动的。这个例子清楚地展示了大数据分析应用程序的需求如何影响数据存储基础设施的开发。


二、存储虚拟化的存储技术

存储系统的容量和性能必须直线升级将问题推到硬件系统上并不是解决问题的办法。存储虚拟化需要新的软件方法来平衡扩展架构,以实现千兆字节的数据传输和存储。
相关存储技术主要有以下几种:
基于主机的存储虚拟化依靠代理或管理软件,安装在一台或多台主机上来实现​​存储虚拟化的控制和管理。由于控制软件在主机上运行,​​因此这将占用主机处理时间。
因此这种方法的可扩展性较差,实际性能也不是很好。基于主机的方法还可能会允许对受保护数据进行意外的未经授权的访问,从而影响系统的稳定性和安全性。
这种方法需要在主机上安装相应的控制软件,因此一台主机的故障会影响整个SAN系统中数据的完整性。由于不同存储厂商的软件和硬件存在差异,软件控制的存储虚拟化还可能带来不必要的互操作开销,因此这种方法也不太灵活。
但由于不需要任何额外的硬件,基于主机的虚拟化方法最容易实现,设备成本也最低。采用这种方式的厂商往往是存储管理领域的软件厂商,目前已经拥有成熟的软件产品。
该软件可以为SAN管理和虚拟化提供易于使用的图形界面,并在主机和小型SAN结构中具有良好的负载平衡机制。从这个意义上说,基于主机的存储虚拟化是一种经济高效的方法。
基于存储设备的存储虚拟化方法依赖于提供相关功能的存储模块。如果没有第三方虚拟化软件,基于存储的虚拟化通常会提供不完整的存储虚拟化解决方案。对于包含多供应商存储设备的SAN存储系统,此方法效果不佳。
依赖于存储供应商的功能模块将排除系统中JBODS(OnlyOneDiskGroup,简单硬盘组)和简单存储设备的使用,因为这些设备不提供存储虚拟化功能。当然,采取这种方法意味着最终锁定单一存储供应商。
基于存储的虚拟化方法还有几个优点:更容易在存储系统中实现,更容易与特定存储厂商的设备协调,因此更容易管理,同时对于用户或管理者来说,一切都是透明的,这会更容易。然而,我们必须注意到,缺乏足够的软件支持使得解决方案更难以适应和监控。
通常,对存储虚拟化实现进行分类的另一种方法是将其分为三种类型:交换结构虚拟化、磁盘阵列虚拟化和集成到应用设备中的虚拟化。对于这三种不同的虚拟化方法,存储厂商都有自己独特的武器库。飞康的IPStor/NSS存储虚拟化产品自2001年开始上市,截至2014年,已正式发布第七代存储虚拟化产品。飞康NSS接管底层存储子系统磁盘卷时,可以通过两种方式实现访问:一是直接将底层磁盘卷虚拟成VirtualDisk(虚拟磁盘),用于NSS管理和调配;可以转换为SED(Service-EnabledDevices)磁盘设备以进行NSS管理和配置。当转换为SED设备时,磁盘卷的原始数据不会被修改,可以通过NSS快速分配给主机系统。整个访问过程非常简单,不需要数据传输,停机时间也很少。当然,也可以实现快速回滚,将磁盘重新分配到原来的主机系统上,并且可以被正确识别和使用。自从两年前IBM推出了SVC(SAN卷控制器)(IBMSANVolumeController),针对存储虚拟化,IBMSANVolumeController。(SVC)可以将多个磁盘系统的容量整合为一个“容量池”,通过整合可以帮助节省空间和能源并简化存储资产的管理,从而提高现有存储的利用率并降低要求。用于额外存储)。它是该领域的领导者。去年,HDS(日立数据系统有限公司)紧随其后,发布了基于磁盘阵列的解决方案TagmaStore通用存储平台(USP)。近几个月,EMC新发布的Invista网络存储虚拟化解决方案就是一个基于存储转换的解决方案。