中国云计算技术(四)
本文讲解中国云计算技术,包括阿里巴巴阿里云服务和云创存储万物云服务,主要分析其计算体系架构和功能服务。
目录
五、阿里巴巴阿里云服务
2009年9月,阿里巴巴集团在十周年庆典上宣布成立新的子公司阿里云。该公司专注于云计算领域的研究,依托云计算的架构做一个可扩展、高可靠、低成本的基础设施服务,支撑包括电子商务在内的互联网应用的发展,从而降低进入电子商务生态圈的门槛、成本,并提高效率。所以阿里巴巴的云计算也被称为电子商务云。
阿里云的定位是云计算的全服务提供商。针对云计算不同层次,阿里云都进行了充分的部署,开发了自己的技术。
阿里云只涉及基础研发,不涉及具体的软件产品的开发。阿里云会为阿里巴巴集团内其他公司提供技术支持,和其他的技术团队一起开发在线服务。主要服务有弹性计算服务ECS、开放存储服务OSS、开放结构化数据服务OTS、开放数据处理服务ODPS、 关系型数据库RDS等。
(一)阿里云计算体系架构
阿里云的核心系统是底层的大规模分布式计算系统(飞天)、分布式文件系统以及资源管理和任务调度。在核心系统之上构建弹性计算服务、开放存储服务、开放结构化数据服务、开放数据处理服务和关系型数据库服务等。阿里云计算体系架构如图所示。
(二)弹性计算服务(ECS)
弹性计算服务即云服务器(Elastic Compute Service,ECS)。它基于阿里云自主研发的飞天大规模分布式计算系统,通过虚拟化技术整合IT资源,为各行业提供互联网基础设施服务。
ECS底层基于分布式计算平台飞天,飞天平台。负责管理实际的硬件资源,向用户提供安全可靠的云服务器,任何硬件的故障都可以自动恢复,同时提供防网络攻击等高级功能,能够简化开发部署过程,降低运维成本,构建按需扩展的网络架构。特点如下。
1)完全管理权限
对云服务器的操作系统有完全控制权,用户可以通过连接管理终端自助解决系统问题,进行各项操作。
2)快照备份与恢复
对云服务器的磁盘数据生成快照,用户可使用快照回滚、恢复以往磁盘数据,加强数据安全。
3)自定义镜像
对已安装应用软件包的云服务器,支持用户自定义镜像、数据盘快照批量创建服务器,简化用户管理部署工作。
4)API接口
使用ECS API调用管理,通过安全组功能可以对一台或多台云服务器进行访问设置,使开发使用更加方便。
5)弹性内存
同一物理机上的VM内存共享,系统自动预测VM内存使用,智能分配与回收。
6)在线迁移
在线迁移时,硬盘与内存、CPU状态不会丢失,迁移耗时因内存大小不同,但应用不中断,如图所示。
(三)开放存储服务(OSS)
开放存储服务(Open Storage Service,OSS),是阿里云对外提供的海量、安全和高可靠的云存储服务。它的主要特点如下。
1)弹性扩展
海量的存储空间,随着用户使用的增加,存储空间弹性增长,无需担心存储容量的限制。
2)大规模并发读写
数据并发读写,在短时间内可以进行大量数据的读/写操作。
3)图片处理优化
对存储在OSS上的图片,支持缩略、裁剪、水印、压缩和格式转换等图片处理功能。
(四)开放结构化数据服务(OTS)
开放结构化数据服务(Open Table Service,OTS)是构建在阿里云飞天分布式系统之上的NoSQL数据库服务,提供海量结构化数据的存储和实时访问。它的主要特点如下。
1)数据的海量存储
支持互联网应用用于服务海量的终端用户,也可用于大规模对数据的存储。
2)简单易用的表管理
用户根据业务需求创建多个实例进行管理。
3)数据的管理
数据的单行读写、多行读写以及范围读取。
(五)开放数据处理服务(ODPS)
开放数据处理服务(Open Data Processing Service,ODPS)[9]由阿里云自主研发,提供针对TB/PB级数据、实时性要求不高的分布式处理能力,应用于数据分析、挖掘、商业智能等领域。它的主要特点如下。
1)海量运算
彻底无极限解决大数据存储与运算瓶颈,可以专心于数据分析和挖掘,最大化发挥数据价值。
2)数据安全
多层次数据存储和访问安全机制,保护数据不丢失、不泄露、不被窃取。
3)开箱即用
无需关心集群的搭建和运维,仅需简单的几步操作,即可开始数据的分析和挖掘任务。
(六)关系型数据库(RDS)
关系型数据库云服务(Relational Database Service,RDS),通过云服务的方式让关系型数据库设置、操作和扩展变得更加简单。它的主要特点如下。
1)安全稳定,数据可靠
RDS集群处于多层防火墙的保护之下,可以有力地抗击各种恶意攻击,保证数据的安全。
2)自动备份,管理透明
RDS根据自定义的备份策略自动备份数据库,防止数据丢失和误删除,保证数据安全可靠。
3)性能卓越,灵活扩容
采用高端高性能服务器配置,为高性能提供了有效的硬件平台。
六、云创存储万物云服务
根据智能硬件、物联网大数据的产生方式和使用特点,在数据立方(DataCube)云计算大数据库基础之上,云创大数据打造了一个超大规模、高可靠、高安全、高性能、 低成本、简捷易用的万物云平台(http://www.wanwuyun.com)。万物云是用于物联网数据存储处理一站式托管服务平台,目的是为了降低物联网应用的技术门槛和成本,将智能硬件快速对接到物联网大数据平台之上,使物联网开发者专注于自己的核心业务,增强核心竞争力。与其他智能硬件平台相比,万物云的最大特点是采用了自主研发的数据立方云计算大数据库,从而先天就具有实时处理万亿量级以上数据规模的优势。
(一)平台简介
云创大数据在现有数据立方(DataCube)产品基础之上, 专门打造了面向智能硬件的公共云计算平台——万物云,如图所示。它是一个功能丰富、简捷易用、安全可靠的物联网应用支撑平台,其核心是一个数据服务逻辑层和一套面向应用的编程接口,满足物联网应用各个层次的数据存储、查询、处理需求,保障用户数据安全和服务稳定,并提供一系列协助用户开发调试、监控性能和优化性能的工具。
有了万物云,智能硬件研发团队只需专注于智能硬件和App本身,而不用花精力在后台的云计算平台研发上。而且,万物云只向10%的数据量最大的客户收费,对于90%的智能硬件团队而言,它是终生免费的。
(二)系统架构
万物云底层基于海量弹性分布式数据存储和计算架构——数据立方(DataCube),在其上构造了一个面向物联网智能硬件应用的业务逻辑层,并提供一个基于HTTP协议的RESTful应用服务调用接口,以及一系列覆盖主流语言和平台应用的编程接口,包括Java、Python、C#、Scala、PHP、Ruby、Node.js等语言。云创大数据物联网大数据平台架构如图所示。
(三)功能服务
万物云按功能可分为数据存储服务和数据处理应用服务。数据存储服务提供海量、弹性、安全、高可用和高可靠的云存储;数据处理应用服务提供针对TB/PB级数据、实时性要求不高的处理服务,主要应用于数据挖掘和数据智能分析等领域。
1. 编程接口
云创大数据物联网大数据平台提供丰富的编程接口,实现了大数据平台所遵循的设计理念:方便智能硬件数据直接接入,减少和简化物联网应用端的代码,降低物联网数据接入和应用的技术门槛。这意味着物联网厂商可以专注于自己的设备开发。
1)基于HTTP协议的数据服务调用接口
构建基于HTTP的RESTful协议接口的目的主要是使智能硬件便捷地通过发送HTTP POST请求直接访问平台大数据服务。RESTful协议将平台的各种数据服务资源映射成URI以供调用,比如智能硬件只要将数据包装成JSON格式,通过访问数据插入服务的URI即可完成数据递交。
HTTP协议服务调用接口支持表的各种基础操作,HTTP协议的通用性保证了大数据平台对物联网应用支持的广泛性。通过HTTP调用,用户可便捷地完成表的增、删、 查、改等操作。
2)应用程序编程接口(JavaAPI等)
大数据平台通过提供软件应用开发包的形式为物联网应用提供具有针对性的数据应用服务,目的在于减少物联网应用端的开发量。与大数据平台的数据处理和分析应用有关的各项功能主要通过专用编程接口提供。如表所示。
操作名称 | 操作目标 |
---|---|
AddTableRow | 插入一行数据 |
AddTableRows | 插入多行数据 |
GetTableRow | 读取一个表中单行数据 |
GetTableRows | 批量读取一个表中若干行数据 |
GetTableRowsByRange | 读取指定主键范围内的数据 |
DeleteTableRow | 删除一个表中一行数据 |
DeleteTableRows | 删除一个表中若干行数据 |
CreateTable | 根据给定的表结构信息创建相应的表 |
DeleteTable | 删除指定的表 |
GetAllTableInfo | 获取当前用户所有表的结构信息 |
GetTableInfo | 获取指定表的结构信息 |
2. 编程接口方法调用示例
1)智能硬件数据提交示例
下面的代码演示了智能硬件如何通过一个HTTP协议的调用将一行数据提交至大数据平台。
2)物联网应用数据读取示例
(1)创建CDS对象,在构造函数中指定供服务安全认证所需的AccessID和AccessKey;
(2)构造请求对象;
(3)调用CDSClient对象相关接口发送请求。
3. 数据安全机制
1)访问许可验证
面对数据处理服务的请求,物联网大数据平台通过使用AccessID/AccessKey对称加密的方法来验证发送请求的用户身份。
2)用户数据分离
大数据平台对用户数据的建表操作采用用户名+实例名+表名的方式,在数据访问时如果表名中的用户名和发送请求的用户名不匹配,服务请求会被拒绝,通过这种方式保证用户只能对自己用户名下的数据资源进行读取和操作。
3)攻击防范机制
大数据平台内建了基本的攻击监测及防范措施。异常的服务请求如过于频繁或数据参数超大的HTTP POST请求会导致服务被拒绝。
4. 智能硬件直通接入方案
用户可以使用HTTP、TCP或MQTT等协议接入智能硬件。物联网智能设备基于常用嵌入式MCU,如ARM、Intel等,可通过SPI/RS485/RS232/I2C等接口外接各种传感器。物联网智能设备搭载的标准Linux、mbed OS等操作系统均支持CoAP、HTTP、MQTT、LWM2M等协议,支持多种通信手段,包括3G/LTE/Bluetooth Smart/Wi-Fi及6toWPAN。智能设备通过无线网络将数据可靠传输到平台服务器,为用户提供一个涵盖数据采集、可靠传输、大数据存储和处理的完整解决方案。
5. 规模和性能
数据立方存储系统支持弹性扩展,用户无需担心存储空间不足。分布式存储系统中各存储节点副本数据实时同步,读写性能不会因数据量增加而受影响。现有平台提供毫秒级单行数据读/写延迟,数据入库可在每秒十万条以上量级,查询在百万QPS级别。
根据物联网应用的特点,物联网大数据平台还提供一系列有针对性的工具,如数据迁移同步、性能监控、辅助调试工具等。
(四)应用举例
依托万物云,云创存储研发了PM2.5云监测平台。该平台突破传统的监测方法,运用创新的设计理念,将环保和云计算技术有机结合。该平台已经向公众免费开放,网址:http://www.mypm25.cn,“我的PM2.5”App可以从安卓和苹果应用分发平台下载。
更多推荐
所有评论(0)