当前位置:首页 > 云计算 > 正文

云计算大数据总结


一、云计算与大数据学习报告云计算和大数据概述云计算(云计算)是基于互联网的相关服务的添加、使用和交付模型,通常涉及通过互联网提供动态扩展且通常是虚拟的资源。云是网络和互联网的隐喻。过去,云经常被用来用图表来表示电信网络,后来也被用来表示互联网和底层基础设施的抽象。狭义的云计算是指IT基础设施的交付和使用的模式,是指通过网络按需获取所需的、易于扩展的资源;广义的云计算是指服务的交付和使用的模式,指的是通过网络按需且轻松扩展的方式来获取您需要的服务。此类服务可以是IT、软件、互联网相关或其他服务。这意味着计算能力也可以作为商品通过互联网进行分发。
大数据,即大数据,是指所涉及的数据量如此之大,以至于无法通过主流软件工具在合理的时间内捕获、管理、处理并组织成有用的信息以实现更积极的目的。在企业的经营决策中。大数据的4V特征:Volume(容量)、Velocity(速度)、Diversity(多样性)和Truth(真实性)。
从技术角度来看,大数据和云计算的关系就像同一枚硬币的两面密不可分。大数据无法由单台计算机处理,必须采用分布式计算架构。其特点在于海量数据挖掘,但必须依赖分布式处理、分布式数据库、云存储和云计算虚拟化技术。
大数据管理,分布式文件系统,如Hadoop、Mapreduce数据分区和并发访问执行,SQL支持,以Hive+HADOOP为代表的SQL接口支持,利用云计算构建下一代大数据;数据技术数据仓库已经成为一个热门话题。从系统需求来看,大数据架构对系统提出了新的挑战:
1.标准机箱可以最大程度地解决某些任务。
2.配置更合理,速度更快。存储、控制器、I/O通道、内存、CPU、网络的均衡设计,以及数据仓库访问的优化设计,比传统同类平台高出一个数量级以上。
3.总体能耗较低。对于相同的计算任务,能耗是最低的。4.系统更加稳定可靠。它可以消除多个单点故障并统一组件或设备的质量和标准。5.管理和维护成本低。数据收集的日常管理全部集成。6.有计划且可预测的系统扩展和升级。
云计算与大数据的关系
简而言之:云计算是硬件资源的虚拟化,而大数据是海量数据的高效处理。虽然这个解释并不完全恰当,但是可以帮助不理解这两个名字的人快速理解其中的区别。当然,如果解释清楚一点的话,云计算就相当于我们的电脑和操作系统,将大量的硬件资源虚拟化,然后分配使用。
可以说,大数据就相当于大数据的“数据库”。纵观大数据领域的发展,我们也可以看到,目前大数据的发展都是朝着同一个方向发展的。类似于传统数据库的经历一句话,传统数据库为大数据发展提供了足够的空间。
大数据整体架构包括数据存储、数据处理和数据分析三层。数据首先要通过存储层进行存储,然后根据数据的需求和目标建立相应的数据模型和数据分析指标体系,对数据进行分析以产生价值。
通过中间数据处理层提供的强大的并行计算和分布式计算能力来实现中间时间精度。三者相互配合,让大数据产生最终的价值。
无论目前云计算的发展如何,未来的趋势是:云计算作为下层的计算资源,支撑上层的大数据处理,大数据发展的趋势是实时交互查询效率和分析能力,借用Google一篇技术论文的一句话:“在Miaji中,通过移动鼠标就可以操纵PB级的数据。