中培伟业IT资讯频道
您现在的位置:首页 > IT资讯 > 国际认证 > CDA LEVEL1业务数据分析师高效备考方法

CDA LEVEL1业务数据分析师高效备考方法

2023-04-18 13:30:11 | 来源:企业IT培训

CDA认证在数据分析方面是较为权威的,CDA LEVEL1业务数据分析师认证考试主要涵盖业务数据分析的基础知识和技能。以下是为大家整理的备考建议。

CDA LEVEL1业务数据分析师备考首先需要熟悉考试内容和结构:在考试之前,应该详细了解考试的内容和结构,包括考试题型、考试时间限制、考试重点和难点等。CDA理事会官方网站提供了详细的考试指南和信息。

其次就是学习业务数据分析基础知识:了解业务数据分析的基本概念、方法和工具,例如数据收集、数据预处理、数据分析、数据可视化等。您可以参考相关的教材、课程。

CDA LEVEL1业务数据分析师认证课程,按照【领会】【熟知】【应用】三个级别学习,高效备考。

PART 1 数据分析概念与统计学基础

1、数据分析概述

【领会】

数据分析和数据挖掘的概念

强调商业数据分析中对业务的理解

商业数据分析和预测的本质

数据分析的8个层次

大数据对传统小数据分析的拓展

【熟知】

明确数据分析目标及意义

数据分析的过程

数据分析与数据挖掘的常用方法

CRISP-DM、SEMMA 方法论

数据分析中不同人员的角色与职责

2、描述性统计分析

【领会】

数据的计量尺度

数据的集中趋势、离中趋势和数据分布的概念

统计图的概念

各种统计图的含义和画法

【熟知】

衡量数据集中趋势、离中趋势和数据分布的常用指标及计算方法统计图形的绘制、图形元素的调整、可视化效果,主要涉及条形图、线图、直方图、盒须图、散点图、气泡图、马赛克图、玫瑰图及其多种图形整合。明确统计图形对统计指标表达上的对应关系

【应用】

根据不同数据类型选用不同的统计指标来进行数据的集中趋势、离中趋势和数据分布的衡量,不同统计图的使用场景。会写数据分析报告和结合业务需求对报告进行合理解释,对业务ᨀ出建设性意见建议。

3、抽样估计

【领会】

随机试验、随机事件、随机变量的概念

总体与样本的概念

抽样估计的理论基础

正态分布及三大分布的函数形式和图像形式

抽样的多种组织形式

确定必要样本容量的原因

【熟知】

随机事件的概率

抽样平均误差的概念与数学性质

点估计与区间估计方法的特点与优缺点

全体总体与样本总体

参数和统计量

重复抽样与不重复抽样

抽样误差的概念对总体平均数和总体成数的区间估计方法

必要样本容量的影响因素

中心极限定理的意义与应用

【应用】

随机变量及其概率分布

全部可能的样本单位数目的概念及其在不同抽样方法下的确定

抽样平均误差在实际数据分析中的计算方法

4、假设检验

【领会】

假设检验的基本概念

其基本思想在数据分析中的作用

假设检验的基本步骤

假设检验与区间估计的联系

假设检验中的两类错误

【熟知】

P值的含义及计算

如何利用P值进行检验

z检验统计量

t检验统计量

F检验统计量

c2检验统计量的函数形式和检验步骤

【应用】

实现单样本t检验

两独立样本t检验的步骤和检验中使用的统计量与原假设

两种检验应用的数据分析场景。

5、方差分析

【领会】

方差分析的相关概念

单因素方差分析的原理

统计量构造过程

【熟知】

单因素方差分析的基本步骤

总离差平方和(SST)的含义及计算

组间离差平方和(SSA)的含义及计算

组内离差平方和(SSE)的含义及计算

单因素方差分析的原假设

【应用】

实现单因素方差分析的步骤

对方差分析表的分析以及多重比较表的分析

6、简单线性回归分析

【领会】

相关图的绘制与作用

相关表的编制与作用

相关系数定义公式的字母含义

估计标准误差与相关系数的关系

【熟知】

相关关系的概念与特点

相关关系与函数关系的区别与联系

相关关系的种类

相关系数的意义以及利用相关系数的具体数值对现象相关等级的划分

回归分析的概念

回归分析的主要内容和特点

建立一元线性回归方程的条件

应用回归分析应注意的问题

估计标准误差的意义及计算

【应用】

运用简捷法公式计算相关系数

相关分析分析中应注意的问题

回归分析与相关分析的区别与联系

PART 2 SQL数据库基础

1、SQL基础概念

【领会】

关系型数据库基本概念、属性

主键

外键

E-R 图

ANSI-SQL 以及不同的数据库实现的关系

【熟知】

逻辑运算符

比较运算符

算术运算符

通配符

2、SQL查询语句

【应用】

select 语句

包括查询单列

多列,去重,前 N 列

from 语句、where 语句、group by 语句、having 语句、order by 语句、子查询

SQL 聚合函数,包括 count、sum、avg、max、min 等

3、SQL连接语句

【领会】

表的连接类型,包括内连接(等值、不等值)、外连接(左、右、全)、交叉连接(笛卡尔连接)查询的集合操作,只包括并集操作

【应用】

inner join 的用法

left/right/full join 的用法

cross join 的用法

union 的用法

4、其他SQL语句

【领会】

表的创建

视图及索引的概念及创建

数据插入、更新、删除

【领会】

高级函数,如 Oracle 或 Hive 中的 row number over partition by、正则匹配等

PART 3数据采集与处理

1、数据采集方法

【领会】

一手数据与二手数据来源渠道

优劣势分析

使用注意事项

【熟知】

一手数据采集中的概率抽样与非概率抽样的区别与优缺点

【运用】

概率抽样方法,包括简单随机抽样、分层抽样、系统抽样、分段抽样

明确每种抽样的优缺点

根据给定条件选择最可行的抽样方式

计算简单随机抽样所需的样本量

Ø 市场调研

【熟知】

市场调研的基本步骤(ᨀ出问题、调查收集材料、分析预测问题)

单选题及多项选择题的设置

数据编码及录入

Ø 数据预处理方法

【熟知】

数据预处理的基本步骤,包括数据集成(不同数据源的整合)、数据探索、数据变换(标 准化)、数据归约(维度归约技术、数值归约技术),这部分内容不需要涉及计算,只需要根 据需求明确可选的处理技术即可。

【应用】

数据清洗,包括填补遗漏的数据值(根据业务场景使用常数、中位数、众数等方法,不 涉及多重查补的方法)、平滑有噪声数据(移动平均)、识别或除去异常值(单变量根据中心 标准化值,多变量使用快速聚类),以及解决不一致问题(熟知概念即可),查重(只考核 SQL 的语句,不涉及 R、SAS 等其它语言)。

点击查看了解更多>>

相关阅读