当前位置：首页 > 云计算 > 正文

云计算与大数据入门

云计算
2024-05-11 05:27:28
3048

一、大数据与云计算具体是学什么的？云计算和大数据概述云计算是添加、使用和提供互联网相关服务的模型，通常涉及通过互联网提供动态且可扩展的资源。云是网络和互联网的隐喻。过去，云经常被用来用图表来表示电信网络，后来也被用来表示互联网和底层基础设施的抽象。狭义的云计算是指IT基础设施的交付和使用模式，是指通过网络以按需且易于扩展的方式获取所需资源；从广义上讲，云计算是指交付和使用模式；服务，是指通过网络按需且易于扩展的方式获取您所需要的服务。这些服务可以是计算机、软件、互联网相关的或其他的。这意味着算力也可以作为商品通过互联网流通。
大数据，即海量数据，是指所涉及的数据量如此之大，以至于使用当前的传统软件工具无法在合理的时间内捕获、管理、处理和组织成有用的信息。公司业务决策的目标更加积极。大数据的4V特征：容量（Volume）、速度（Velocity）、多样性（Variety）和准确性（Veracity）。
从技术角度来看，大数据和云计算的关系就像同一枚硬币的两面密不可分。大数据无法由单台计算机处理，必须采用分布式计算架构。其特殊性在于海量数据的开发，但必须依赖分布式处理、分布式数据库、云存储和云计算虚拟化技术。
大数据管理，分布式文件系统，如Hadoop、Mapreduce数据切分并同时访问执行，支持SQL，支持以Hive+HADOOP为代表的SQL接口，利用云计算构建下一代大数据;数据技术数据仓库已经成为一个热门话题。从系统需求来看，大数据架构对系统提出了新的挑战：
1．标准机箱尽可能完成特定任务。
2.配置更合理，速度更快。存储、控制器、I/O通道、内存、处理器和网络的均衡设计，以及数据仓库访问的优化设计，比传统同类平台高出一个数量级。
3.总体能耗较低。对于相同的计算任务，能耗是最低的。
4.系统更加稳定可靠。它可以消除各种单点故障并统一组件或设备的质量和标准。
5.管理和维护成本低。数据收集的日常管理完全集成。
6.可规划和可预测的系统扩展和升级的路线图。
云计算与大数据的关系
简单来说：云计算是硬件资源的虚拟化，而大数据是海量数据的高效处理。虽然这个解释并不完全恰当，但是可以帮助不懂这两个名字的人快速理解其中的区别。当然，如果解释清楚一点的话，云计算就相当于我们的电脑和操作系统，将大量的硬件资源虚拟化，然后分配使用。
可以说，大数据相当于海量数据的“数据库”。纵观大数据领域的发展，也可以看出，当前大数据的发展正在朝着一定的方向发展。类似于传统数据库的体验。一句话，传统数据库为大数据发展提供了足够的空间。
大数据整体架构包括数据存储、数据处理、数据分析三层。数据首先要通过存储层进行存储，然后根据数据的需求和目的建立相应的数据模型和数据分析指标体系，对数据进行分析以产生价值。
中间速度是通过中间数据处理层提供的强大的并行计算和分布式计算能力来实现的。三者相互配合，让大数据产生最终价值。
无论云计算目前发展如何，未来的趋势是：云计算作为下层计算资源，支撑上层大数据处理，大数据的发展趋势是实时交互询问。效率和分析能力，借用谷歌技术文档的一句话：“只需简单的鼠标移动，就可以在Miaji中挖掘PB级数据。”