当前位置:首页 > 云计算 > 正文

云计算和算法(云计算为什么叫云)


一、什么是云计算?什么是大数据?二者有何联系?

云计算的关键词是“集成”。无论是使用传统的、现在已经非常成熟的虚拟机分割技术,还是后来Google使用的海量节点聚合技术,这都是通过海量服务器资源的整合来完成的。它们通过网络集成、调度并分配给用户,从而解决用户因存储和计算资源不足而带来的问题。

大数据是数据爆发式增长带来的新课题,如何存储当今互联网时代产生的庞大数据,如何有效利用和分析这些数据等等。

这样就可以理解两者的关系了。云计算技术是一个容器,大数据就是这个容器里储存的水。大数据依靠云计算技术进行存储和处理。

扩展信息:

云计算经常与网格计算、效用计算和自主计算相混淆。

网格计算:分布式计算的一种,由一组松散耦合的计算机组成的虚拟超级计算机,常用于执行大规模任务;

效用计算:IT资源打包计费方式,基于计算和存储分别计量成本,如电力等传统公共服务;

自主计算:具有自我管理功能的计算机系统。

确实,云计算的很多实现方式都是基于计算机集群(但它们在组成、架构、用途和网格的工作方法上有很大不同),并且也吸收了计算自主和效用计算的特点。

人们普遍接受的云计算特点如下:

(一)超大规模

“云”具有相当规模,谷歌云计算已经拥有超过100万台服务器以及亚马逊、IBM、微软、雅虎等的“云”。他们都拥有数十万台服务器。企业私有云通常拥有数百或数千台服务器。“云”可以为用户提供前所未有的计算能力。

(2)虚拟化

云计算帮助用户在任何地点、使用各种终端获取应用服务。所需的资源来自“云”而不是固定的有形实体。应用程序运行在“云”中的某个地方,但用户实际上不需要知道或关心应用程序运行的具体位置。只需一台笔记本电脑或手机,我们所需的一切都可以通过网络服务完成,甚至包括超级计算之类的任务。

(三)高可靠性

“云”通过数据多副本、容错、计算节点同构互换等措施,保证用户所使用的服务的高可靠性。云计算比使用本地计算机更可靠。

(4)通用性

云计算不针对特定应用。在“云”的支持下,可以构建不断发展的应用程序。同一个“云”可以同时支持多个应用程序。

(5)高扩展性

“云”的规模可以动态扩展,以满足应用和用户的增长需求。

(六)按需服务

“云”是一个巨大的资源池,您可以按需购买;云可以像自来水、电和煤气一样计费。

大数据的特点:

1体量:数据的大小决定了所考虑的数据的价值和潜在信息

2类型(Variety):数据类型的多样性;

3速度:指获取数据的速度;

4可变性(Variability):阻碍了数据过程的有效处理和管理。

5真实性:数据的质量

6复杂性:海量数据来自多个渠道

7价值:合理利用大数据以低成本创造高价值

如果你想系统认识大数据,就必须把它彻底、仔细地分解,从三个层次开始:

第一个层次是理论,只有一种认知途径,也是被广泛认可和广泛使用的基线。这里我们将从大数据特征的定义来了解行业的一般描述以及大数据的表征;我们将从对大数据价值的讨论中,深入剖析大数据的珍贵,获取大数据发展趋势的详细信息;并从大数据隐私这一特殊而重要的问题出发。从一个角度审视人与数据之间的长期博弈。

第二个层次是技术:技术是体现大数据价值的手段,是进步的基石。这里将从云计算、分布式处理技术、存储技术和感知技术的发展角度来阐述大数据从采集、处理、存储到形成结果的整个过程。

第三个层次是实践,实践是大数据价值的最大体现。这里我们将从互联网大数据、政府大数据、企业大数据和个人大数四个方面来描述大数据所展现的美好景象及其即将实现的蓝图。

参考资料:-大数据-云计算


二、云计算关键技术是什么?云计算的关键技术有以下三点:
⑴虚拟化技术:云计算的虚拟化技术不同于传统的单一虚拟化。它涵盖了整个IT架构,包括资源、网络、应用程序和工作站。其特点是可以隔离所有硬件设备、软件应用和数据,打破硬件配置、软件部署和数据分布的限制,实现计算机架构的动态化,实现集中资源管理和创建应用。能够动态地使用虚拟和物理。资源来提高系统适应需求和环境的能力。
对于信息系统仿真来说,云计算虚拟化技术的重要性不仅在于提高资源利用率、降低成本,还在于为计算机提供强大的能力。众所周知,信息系统仿真系统是一个计算量大的复杂系统。计算能力对系统运行的效率、准确性和可靠性影响很大,而虚拟化技术可以转换大量分散且未充分利用的数据。计算能力与计算负载较高的计算机或服务器集成,实现全网资源的统一规划和使用,从而在存储、传输、计算等多个计算方面实现高效率。
⑵分布式资源管理技术:大多数情况下,信息系统仿真系统将处于多节点并发执行环境中。为了保证系统状态的正确性,必须保证分布式数据的一致性。为了解决分布一致性问题,IT行业的许多公司和研究人员提出了各种协议。这些协议是云计算出现之前必须遵循的规则。得到解决。它基于众多协议。然而,对于大型甚至超大规模的分布式系统,无法保证所有子系统和子系统都使用相同的协议,也无法保证分布一致性问题得到解决。云计算中的分布式资源管理技术成功地解决了这个问题。Google的Chubby是最著名的分布式资源管理系统。系统实现了Chubby服务锁定机制,使解决分布一致性问题不再单纯依赖于一种协议或算法,而是拥有统一的服务(service)。
⑶并行编程技术:云计算采用并行编程模型。在并行编程模式下,并发处理、容错、数据分布、负载均衡等细节都通过统一的接口汇总到函数库中,用户的大规模计算任务自动同时分布式执行。,一个任务自动划分为多个子任务,并行处理海量数据。