当前位置:首页 > 数据中心 > 正文

数据中心组织流程


一、数据处理有什么流程?

数据治理过程是从数据规划、数据采集、数据存储管理到数据应用的从混乱到有序的过程,以及创建标准化流程的过程。

根据各个流程的特点,数据治理流程可以概括为四个词:“管理”、“采集”、“存储”、“使用”。



1.管理:组织业务流程,规划数据资源

>

对于企业来说,每天的实时数据超过TB级别。您在哪里以及如何放置和收集大量数据?

这些问题需要提前规划和一系列从故障到订单的流程。这个过程需要跨职能协作,包括前端、后端、数据工程师和数据分析角色。工程师、项目经理等

2.采集:ETL采集、去重、脱敏、转换、关联、异常值去除

前端和后端将采集到的数据提供给数据部门去做。数据部门通过ETL该工具从源到目的地提取、转换和加载数据,目的是集中存储分散的、杂乱的数据。

3.存储:大数据的高性能存储和管理

大量的业务数据驻留在哪里?为了提供便利,我们需要一个高性能的大数据。存储系统,数据被分类到相应的库中。

4.用途:实时查询、报表监控、智能分析、模型预测

数据的最终目的是支持业务决策。为最终的查询、分析和监控铺平道路。

这个阶段是数据分析师的家,他们使用这些标准化数据来运行实时查询,建立指标和报告系统,还可以分析和预测模型。


二、如何构建云数据中心

NewMedia新媒体联盟创始人、移动互联网时代趋势观察者袁国宝在新书《新基建:数字经济重构经济增长新格局》中写道,构建云的详细步骤数据中心主要分为3个步骤。

新基础设施

1.虚拟化

利用软件和硬件管理程序将物理资源映射为虚拟资源的技术称为虚拟化技术。关键IT资源虚拟化是构建云数据中心的基础和前提。

云数据中心需要虚拟化的关键IT资源主要包括服务器、存储和网络。其中,服务器虚拟化主要包括Unix服务器虚拟化和x86服务器虚拟化。Unix服务器也被称为小型机,小型机厂商一般都会为自己的小型机产品开发差异化的虚拟化方案。因此,这些虚拟化程序无法虚拟化其他厂商的小型机产品。

目前,市场上常见的x86服务器虚拟化产品有VMwareESX/ESXi、微软的Hyper-V、开源的KVM虚拟机等,Oracle、华为等服务器厂商也开发了基于x86服务器的虚拟化平台。Xenia内核。

云数据中心需要同时使用不同厂商、不同类型的服务器资源。服务器虚拟化后,可以有效解决不同服务器之间硬件差异的问题,让用户能够以标准的逻辑形式获得计算。资源。

存储虚拟化的逻辑是在物理存储系统上增加一个虚拟层,将物理存储虚拟成逻辑存储单元。通过存储虚拟化,云数据中心服务提供商可以将不同品牌、级别的存储设备资源整合成一个大的逻辑存储空间,然后对这个存储空间进行划分,以满足不同用户的个性化需求。

网络虚拟化涉及网络设备、网络安全设备和网络本身的虚拟化。其中,需要虚拟化的网络设备和网络安全设备包括网卡、路由器、交换机、HBA卡、防火墙、IDS/IPS、负载均衡设备等。网络本身的虚拟化主要涉及FC存储的虚拟化网络和IP网络。

当前,个人和组织的网络需求日益个性化。为了以更低的成本满足自己的需求,云数据中心厂商对网络进行虚拟化成为必然选择。同时,网络虚拟化后,云数据中心可以在网络环境和多层应用环境中对不同群体的用户进行逻辑隔离,不仅可以提高数据安全性,还可以降低网络管理复杂度。

关键IT资源虚拟化后,云数据中心服务商可以统一部署、集中共享这些资源,大大提高资源利用率。测试数据显示,虚拟化之前,数据中心IT资源利用率仅为10%~20%,而虚拟化之后,资源利用率达到50%~60%。

2.资源池化

资源池化是指IT资源虚拟化后,被打上特定的功能标签,然后分配到不同的资源组。最终完成其池化。

资源池可以解决不同结构的IT设备规格、标准差异的问题,对资源进行逻辑分类和分组,最终以标准化的逻辑形式将资源提供给用户。在资源池化过程中,云数据中心服务商可以根据硬件特性划分不同服务级别的资源池组。云数据中心的资源池主要包括服务器资源池、存储资源池和网络资源池。

云数据中心服务商在存储资源池化过程中,需要重点分析存储容量、FCSAN网络所需的HBA卡端口数量、FCSAN网络所需的网卡端口数量是否符合要求。IP网络等与自身业务规模相符。匹配。

云数据中心服务商在网络资源池化过程中,需要重点分析进出口链路带宽、HBA卡及端口数量、IP网卡及端口数量、安全设备端口数量、带宽等与网络资源池化流程一致。与自身业务规模相匹配。

3.自动化

自动化是指使IT资源按照预设的流程进行处理的过程。如果说IT资源的虚拟化和池化可以让数据中心的计算能力、存储空间、网络带宽和链路成为一个动态的基础设施,那么IT资源的自动化则可以让数据中心获得一套能力。基础设施自动化管理的有效工具。

云数据中心可以使用基于SOA的流程管理工具来统一数据中心内业务任务和IT任务的IT编排。然后使用可编程工作流工具将工作流和流程执行逻辑与资产解耦。借助IT编排工具,系统设计人员可以修改现有工作流程、添加新工作流程,甚至使用可重用适配器修改资产等,而无需重新开始工作,有效减少开发人力、材料成本。