云数据中心

云数据中心

所谓的 IT 架构广泛理解即是 Informatica and Communications Technology Infrastructure,其由硬件设备、数据中心系统、企业级软件、电信服务、信息技术服务等几方面构成。而其中的数据中心系统则是现代 IT 核心基础架构,它是云计算的物理载体,为云计算提供底层的数据处理、存储和高性能计算的一体化支撑;数据中心包含了冷却、网络、机房空间、服务器、能耗管理、存储等多个方面。超大规模的云计算数据中心中 PUE(Power Usage Efficiency)则显得尤为重要;现代化的数据中心也采用了虚拟化、软件定义实现按需分配 IT 资源,最大化资源利用率。

IT 产业始于 1964 年,第一代平台以大型机与终端机为典型代表,服务于百万级用户;第二代平台始于 1981 年,以局域网、服务器、因特网为典型代表,服务于亿级用户,万级应用;第三代平台始于 2012 年,以云计算、大数据、移动与社交为典型代表,服务于数十亿用户。云计算从运营模式分为了公有云、私有云与混合云三种。

公有云按照交付模式,又分为 IaaS、PaaS、SaaS 这三种,越来越多的企业也选择了从自建 IT 架构到租借公有云服务商提供的云服务。公有云能够帮助企业实现均衡优化的 IT 资源管理,降低整体成本,并且将企业固定成本转化为可变运营成本;从而能够让企业聚焦其核心业务。云计算将传统的烟囱模式:网络->存储->计算->虚拟化->系统->中间件->运行环境->数据,改造为了硬件资源层->虚拟化层->云管理层->应用平台层->应用层架构。

云计算融合了虚拟化技术、分布式数据存储技术、大规模数据管理技术、编程模型、分布式的资源管理、云计算平台管理技术、信息安全等多个领域,其中虚拟化技术是云计算技术的核心之一,为云计算技术提供了基础架构的支撑;不过需要注意的是,云计算不仅仅是虚拟化,而是从单一虚拟化走向了以资源为核心,以应用为核心的阶段。在以应用为核心阶段,云计算的核心技术包括了 PaaS、容器引擎、应用管理框架、容器集群资源管理等方面。

大数据指的是所涉及的资料量的规模巨大到无法通过人工在合理时间内获取、管理和处理的数据集合。一般来说,数据类型分为传统企业数据,即企业的 ERP 数据、库存数据、账目数据等;机器产生和传感器数据,包括呼叫记录、智能仪表、工业设备传感器、设备日志、交易数据等等;还有就是社交数据,譬如用户行为记录、反馈数据等。而我们所谓的大数据处理平台包含了数据的采集、传输、存储、分析、挖掘、可视化、价值体现等完整的大数据处理过程。

传统企业应用的特征是成熟的架构设计、标准的套装软件与良好的纵向扩展能力,而云计算应用的特征是基于开源平台开发、良好的横向扩展能力与很强的自愈能力。现代互联网用户的应用需求包括了实时-RealTime,按需定制-OnDemand,全在线-All on-line,自助服务-DIY,社交分享-Social 这几个部分。

AWS 的举措:从 IaaS 向 PaaS 扩展、向传统企业级市场进军。2013 年,CIA 情报社区云项目的竞标中 AWS 以高价但优质的云数据中心服务战胜了 IBM 的传统数据中心,云数据中心已然成为了未来 IT 发展的方向与必然选择。传统数据中心装上云操作系统,变成水平扩展的云数据中心。云操作系统把服务器、网络、安全等 IT 设备能力变为 IT 服务,提供给平台软件和应用软件使用。云数据中心提供 IT 服务,实现了资源共享、资源的水平扩展,提高了资源利用率,并且使能低成本线性扩容,扩容不需要暂停业务。

NFV 表示网络功能虚拟化,SDN 表示软件定义网络,两种技术的核心即是用 IT 技术改造 CT 网络,重构电信网络的核心。

数据中心机房配套层标准与数据中心基础设施层标准,其中机房配套层常见的是 Uptime 标准和 ISO17001 标准,Tier 4 指全年只能有不超过 24 分钟的服务不可用,而 Tier 3 指全年可以有不超过 1.6 小时的不可用;PUE 指机房用电总量是 IT 设备用电量。基础设施层则是 SHARE 78 国际标准,其定义了 1 到 7 级标准,容灾级别越高,RTO 恢复时间就越短,成本越高。而目前云服务的事实标准则是 OpenStack

我们还需要强调企业级云数据中心的统一架构,资源池是云数据中心的基本单元,包括了计算资源池、存储资源池、网络资源池等等。统一架构的核心就是物理分散、逻辑集中、异构共存、资源共享、按需服务。

大型企业的演进策略是,通过 DC 整合进行全局规划、分布实施:包括建立云 DC 核心样板点,确立云服务标准;建立云 DC 企业级统一调度平台;向周边复制云 DC,强化网络自动化,实现多 DC 互连互通;将业务云化搬迁到云 DC 上;持续优化经营。而小公司的演进策略往往是通过融合资源池,以点带面,逐步渗透。

为了更好地实践统一的云管理平台和主动运维模式,Google 建立了全局资源集中管控面与大数据平台。主动运维的核心是企业级 DC 的运行可视化,健康可视化帮助推动运维转型,从被动运维到主动运维;还需要通过脚本编程将运维经验固化下来。还需要辅助以良好的云服务流程机制和资源调度管理,企业级 DC 资源调度往往分为两种方式:IT 系统设置规则或者大的业务部门之间,要考资源的配额调度去管控;企业应该构建具有自我约束、自我修复的云服务流程,并且建立专门的组织保障企业级的资源可调度。

传统的数据中心是面向应用软件提供设备,属于典型的烟囱式架构;而云数据中心致力于提供 IT 服务,属于共享服务式架构。

传统数据中心的 IT 资源是各个业务应用独占,即使某个业务处于波谷阶段也无法将资源分配给其他波峰阶段的业务使用;并且传统数据中心只能采用垂直扩容方式,扩容时业务需要中断,并且基础设施的建设时间也过长。云数据中心则能有效实现企业级资源共享,能够在分钟级完成资源获取。