数据挖掘(山东联盟) 智慧树答案2024版100分完整版

肠喝暑哗膏蔷肮撵殿魔零力刹

第一章 单元测试

1、 数据挖掘就是从大量的、( )数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。( )。

A:不完全的
B:有噪声的
C:模糊的
D:随机的
答案: 不完全的
有噪声的
模糊的
随机的

2、 互联网本身具有( )的特征,这种属性特征给数据搜集、整理、研究带来了革命性的突破。( )。

A:数字化
B:互动性
C:快速性
D:共享
答案: 数字化
互动性

3、 KDD和数据挖掘可以应用在很多领域中,它们具有如下一些公共特征:( )。

A:海量数据集
B:数据利用非常不足
C:在开发知识发现系统时,领域专家对该领域的熟悉程度至关重要
D:最终用户专门知识缺乏
答案: 海量数据集
数据利用非常不足
在开发知识发现系统时,领域专家对该领域的熟悉程度至关重要
最终用户专门知识缺乏

4、 大数据的特征有( )。

A:Volume
B:Variety
C:Value
D:Velocity
答案: Volume
Variety
Value
Velocity

5、 从宏观上看,数据挖掘过程主要由三个部分组成,即( )。

A:数据整理
B:数据挖掘
C:结果的解释评估
D:数据收集
答案: 数据整理
数据挖掘
结果的解释评估

第二章 单元测试

1、 不完整数据的成因有( )。

A:数据收集的时候就缺乏合适的值
B:数据收集时和数据分析时的不同考虑因素
C:人为/硬件/软件问题
D:其他
答案: 数据收集的时候就缺乏合适的值
数据收集时和数据分析时的不同考虑因素
人为/硬件/软件问题

2、 处理空缺值的主要方法有( )。

A:忽略元组
B:使用一个全局常量填补空缺值
C:使用属性的平均值填补空缺值。
D:使用与给定元组属同一类的所有样本的平均值。
答案: 忽略元组
使用一个全局常量填补空缺值
使用属性的平均值填补空缺值。
使用与给定元组属同一类的所有样本的平均值。

3、 给定一个数值属性,怎样才能平滑数据,去掉噪声?( )。

A:分箱(binning)
B:聚类
C:计算机和人工检查结合
D:回归
答案: 分箱(binning)
聚类
计算机和人工检查结合
回归

4、 数据集成时需解决的三个基本问题为( )。

A:模式集成的过程中涉及到的实体识别问题
B:冗余问题
C:数据集成过程中数值冲突的检测与处理
D:降维
答案: 模式集成的过程中涉及到的实体识别问题
冗余问题
数据集成过程中数值冲突的检测与处理

5、 常用的数据转换方法有( )。

A:平滑
B:聚集
C:属性构造
D:数据概化
答案: 平滑
聚集
属性构造
数据概化

第三章 单元测试

1、

下列哪个算法不属于层次聚类算法?( )。

A:K-means  
B:Agnes
C:BIRCH
D:CURE
答案: K-means  


上方为免费预览版答案,如需购买完整答案,请点击下方红字

点击这里,购买完整版答案


催悍短斯猜册碳恳华硼烩班猫