大数据存储方式是对海量结构化、半结构化和非结构化数据的存储和管理。轻量级数据库无法满足其存储,通常采用复杂的数据挖掘和分析操作。分布式文件系统、NoSQL数据库、云数据库等
大量结构化、半结构化和非结构化数据的存储和管理。轻量级数据库无法满足其复杂的数据挖掘和分析操作。他们通常使用分布式文件系统。NoSQL数据库、云数据库等
1分布式系统:分布式系统包含多个自治处理单元,这些处理单元通过计算机网络互连协作完成分配的任务。其分而治之的策略可以更好地处理数据分析问题。
主要包括以下两类:
1)分布式文件系统:存储管理需要多种技术协同工作,其中文件系统提供最底层存储的能力支持。HDFS分布式文件系统是一个高容错系统,专为批处理而设计,能够提供高吞吐量的数据访问。
2)分布式键值系统:分布式键值系统用于存储关系简单的半结构化数据。典型的分布式键值系统包括AmazonDynamo,广泛使用和流行的对象存储技术(ObjectStorage)也可以认为是键值系统,它存储和管理对象而不是数据块。
2Nosql数据库:关系型数据库已经不能满足Web2.0的需求。主要表现在:无法满足管理大量数据的需求,无法满足高数据并发的需求,高扩展性和高可用功能太低。NoSQL数据库的优点:可以支持大规模数据存储,灵活的数据模型可以很好地支持Web2.0应用,具有很强的水平扩展能力。典型的NoSQL数据库包括以下几种:
3云数据库:云数据库是基于云计算技术发展的基础设施共享方式。它是云计算环境中的分布式虚拟化数据库。
上一篇:云计算代替数据库
下一篇:云计算与数据库的关系