数据挖掘（山东联盟）智慧树答案2024版100分完整版

肠喝暑哗膏蔷肮撵殿魔零力刹

第一章单元测试

1、数据挖掘就是从大量的、（）数据中，提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。（）。

A:不完全的
B:有噪声的
C:模糊的
D:随机的
答案: 不完全的
有噪声的
模糊的
随机的

2、互联网本身具有（）的特征，这种属性特征给数据搜集、整理、研究带来了革命性的突破。（）。

A:数字化
B:互动性
C:快速性
D:共享
答案: 数字化
互动性

3、 KDD和数据挖掘可以应用在很多领域中，它们具有如下一些公共特征：（）。

A:海量数据集
B:数据利用非常不足
C:在开发知识发现系统时，领域专家对该领域的熟悉程度至关重要
D:最终用户专门知识缺乏
答案: 海量数据集
数据利用非常不足
在开发知识发现系统时，领域专家对该领域的熟悉程度至关重要
最终用户专门知识缺乏

4、大数据的特征有（）。

A:Volume
B:Variety
C:Value
D:Velocity
答案: Volume
Variety
Value
Velocity

5、从宏观上看，数据挖掘过程主要由三个部分组成，即（）。

A:数据整理
B:数据挖掘
C:结果的解释评估
D:数据收集
答案: 数据整理
数据挖掘
结果的解释评估

1、不完整数据的成因有（）。

A:数据收集的时候就缺乏合适的值
B:数据收集时和数据分析时的不同考虑因素
C:人为/硬件/软件问题
D:其他
答案: 数据收集的时候就缺乏合适的值
数据收集时和数据分析时的不同考虑因素
人为/硬件/软件问题

2、处理空缺值的主要方法有（）。

A:忽略元组
B:使用一个全局常量填补空缺值
C:使用属性的平均值填补空缺值。
D:使用与给定元组属同一类的所有样本的平均值。
答案: 忽略元组
使用一个全局常量填补空缺值
使用属性的平均值填补空缺值。
使用与给定元组属同一类的所有样本的平均值。

3、给定一个数值属性，怎样才能平滑数据，去掉噪声？（）。

A:分箱（binning）
B:聚类
C:计算机和人工检查结合
D:回归
答案: 分箱（binning）
聚类
计算机和人工检查结合
回归

4、数据集成时需解决的三个基本问题为（）。

A:模式集成的过程中涉及到的实体识别问题
B:冗余问题
C:数据集成过程中数值冲突的检测与处理
D:降维
答案: 模式集成的过程中涉及到的实体识别问题
冗余问题
数据集成过程中数值冲突的检测与处理

5、常用的数据转换方法有（）。

A:平滑
B:聚集
C:属性构造
D:数据概化
答案: 平滑
聚集
属性构造
数据概化

1、

下列哪个算法不属于层次聚类算法？（）。

A:K-means
B:Agnes
C:BIRCH
D:CURE
答案: K-means

上方为免费预览版答案，如需购买完整答案，请点击下方红字

催悍短斯猜册碳恳华硼烩班猫