阿里云大数据助理工程师ACA认证最新笔记(2023)

首先谈论一下考试相关
本人与最近学习并通过了阿里云云计算助理工程师ACA认证,购买了认证包,有6个月的时间,无数次的观看视频,每个沙箱实验都有两次机会,另外两次考试的机会,机会用完也就意味着需重新购买认证包(很脑残)。
考试时间50分钟,作弊系统全程摄像,题型包括单选题、多选题、判断题。
刚开始真的没有方向,不知道题型和考试大概的内容,很迷茫,怕错过两次机会,600块泡汤。

tips:xmd注意了,从2021年10月1日起,认证考试要80分以上才算及格!

认证要求

阿里云大数据助理工程师认证(Alibaba Cloud Certified Associate,ACA) 是面向使用阿里云大数据产品的专业技术认证,主要涉及阿里云的大数据计算、存储、开发平台,数据应用类的基础产品。是对学员掌握阿里云大数据产品技术技能水平的全面检验和能力认证。

  1. 概述
    数加是指阿里云大数据平台,包含了一系列的大数据产品及服务。
    计算引擎(三类):离线计算、流式计算、在线计算

  2. MaxCompute
    由阿里云自主研发,提供针对TB/PB级数据、实时性要求不高的分布式处理能力,应用于数据分析、挖掘、商业智能等领域。阿里巴巴的数据业务都运行在MaxCompute上。
    特点:分布式(分布式集群架构)、安全(自动存储容错)、易用性(标准接口服务)、管理与授权(多用户的管理协同)
    MaxCompute对象
    Project 项目空间
    所有对象都隶属于项目空间
    计量计费及安全控制的基本单元
    Table 表所有的数据都存储在表露
    支持表分区,支持依赖于表的视图
    Partition 分区上传时,手工创建分区并保证质量
    使用insert数据时支持动态分区
    其它概念
    Task 任务
    MaxCompute基本计算单元,SQL及MR都是通过任务完成的
    Instance 实例
    任务的一个具体实例,表示实际运行的task
    Sandbox 沙箱
    按照安全策略限制程序行为的执行环境
    分区表指的是在创建表时指定分区键,即指定表内的某几个字段作为分区列。在使用数据时如果指定了需要访问的分区名称,则只会读取相应的分区,避免全表扫描,提高处理效率,降低费用
    MaxCompute数据类型:bigint、string、boolean、double、datetime、edecimal
    MaxCompute架构:
    客户端:eclipse、clt、管理控制台(DMS)、dataide、intelij
    接入层
    逻辑层:请求分为计算型和非计算型。如果是非计算型,则请求处理器处理后返回。如果是计算型。则交给调度器处理。但其实调度器也不是做真正的处理,而是以xml文件的形式交给计算层进行处理。
    计算层

Tunnel基本语法
1.tunnel或者tunnel help查看帮助信息
2.tunnel upload [options] <[project.]table[/partition]> 数据上传

1.[单选]MaxCompute项目空间A设置了项目空间保护:setProjectProtection=tue:并且将项目空间B设置为可信空间: add trustedproject B:无其他任何设置。以下说法中正确的是()
A.项目空间A和项目空间B中的数据可双向
B.项目空间B中的数据只可以流至项目空间
C.项目空间B中的数据可以流至项目空间A
D.项目空间A中的数据可以流至项目空同B
答案:C
解析:但是在某些情况下,由于业务需要,用户Alice经过项目空间管理员Jack同意后,需要将某些数据表导出到项目空间之外。针对这类情况,MaxCompute提供了TrustedProject机制来支持受保护项目空间的数据流出。您可以通过设置TrustedProject,将prj2设置为prj1的可信项目空间,设置完成后,prj1中的所有数据将被允许流出到prj2。设置命令如下。use prj1; add trustedproject prj2;

2.[单选]如果需要在分析型数据库AnalyticDB中创建一个产品信息表(条数为百万级在业务中需要和订单表(条数为亿级)预售表(条数为千万级)等做综合分析则创建这张表的合适方法是()。
A.创建为-张普通表并放置到一个普通表组中
B.创建一张维度表并放到维度表组中
C.创建一个维度表并放置到普通表组中
D.创建一个维度表并放到普通表组中
正确答案: B

3.[单选]在分析型数据库Analytic中如果知道某表中的一列经常 会被作为查询条件()可以提升查询性能。
A.指定该列不创建索引
B.指定该列创建HashMap索引
C.指定该列创建索引
D.不需要特别设定系统会自动创建索引
正确答案: D

4.[单选]在大数据开发套件DatalDE中任务节点/工作流任务可以配置跨周期依赖如果任务A和B都是按小时调度任务B配置依赖任务A的上周期,则()
A.任务B的实例都将依赖A昨天所有实例
B.任务B的实例都将依赖A昨天所有实例和A与B同周期的前一-个周期实例
C.任务B的实例都将依赖A与B同周期的前个周期实例
D. 任务B的实例都将依赖A昨天所有实例和A与B同周期的前一个周期实例
正确答案: C

5.[多选]分析型教据AnalytcDB是阿里巴巴自主研发的十对得量数据实时,离井 发的在线分析服务。以下关于其特点的说法中正确的有()
至少选择一个 答案选项.
A .支持聚类,分类等复杂的数据分析
B .简单的使用方式, 支持类SQL的查询语法
C.极速的响应时间, 支持百亿级的数据毫秒级计算
D.丰富的特 色功能,包括tunnel命 令等高連上传下载工具
正确答案: ABC

6.[多选]大数据语境下,客户场景越来越多越来越复杂大部分场景下就计算本身(计算触发的方式响应时间等的特点来讲可以归结为三种计算场景包括()
至少选择一个 答案选项.
A.内存计算
B.离线计算
C.云计算中
D.网格计算
E.在线计算
F.流计算
正确答案:BEF

7.[多选]在分析型数据AaycDB中创建张维度Brouo 0以下的SaL命中正确的有().
至少选择一个答 案选项
A、CREATE DIMENSION TABLE my. project poduct thl (a int. produet name varchar produet date datol
B、CREATE DIMENSION TABLE my_ project product tb (d int product .name varchar,producet date date primary key (0)
C、CREATE DIMENSION TABLE my. project producet tbl (id int, product name varchar, product_ date date .primay key (d)) PARTTION BY HASH KEY(id)
正确答案: BC

8.[判断]分析型数据库AnalyticDB的表组包括普通表组和维度表组,可以通过数据管理系统DMS或是SQL命令创建和删除各类表组。
A)对
B)错
正确答案:错

9.[判断]MaxCompute的sQL语句执行速度取决于表的大小比方读取一个10K的表读取全表数据消耗的时间在100毫秒左右。
A)对
B)错
正确答案:错

10.[判断]某个创业公司打算采用阿里云大数据计算服务MaxCompute为自身用户提供产品推荐的服,务但是公司初期的用户数并不太多而MaxCompute的存储费用相对云数据库RDs较高应该推荐其等到用户数量增加到- -定规模再使用MaxCompute的服务。
A)对
B)错
正确答案:错

DataIDE角色 平台权限
项目管理员 项目空间的管理者,可对基本属性、数据源、计算引擎配置和项目成员等进行管理
开发 能够创建工作流、脚本文件、资源和UDF,新建/删除表,同时可以创建发布包,但不能执行发布操作
运维 由项目管理员分配运维权限;拥有发布及线上运维的权限,没有数据开发的权限
部署 部署角色与运维角色相似,但是它没有线上运维的权限
访客 只具备查看权限

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐