大数据基础与应用(罗薇)(桂林理工大学) 中国大学慕课答案2024完整版100分

笆汝潘貌闷速彩僧啡寡涕沸狡

对应课程:点击查看
起止时间:2020-03-10到2020-07-12
更新状态:已完结

第1周初识大数据 第一周单元测试

1、 大数据的特性不包括

A:应用领域广
B:容量大
C:速度快
D:价值密度低
答案: 应用领域广

2、 如下关于大数据分析流程的哪一项是正确的?

A:数据采集、数据清洗、数据管理、数据分析、数据呈现
B:数据采集、数据分析、数据清洗、数据管理、数据呈现
C:数据采集、数据呈现、数据分析、数据清洗、数据管理
D:数据清洗、数据采集、数据呈现、数据分析、数据管理
答案: 数据采集、数据清洗、数据管理、数据分析、数据呈现

3、 大数据分析与传统的数据分析的区别主要在于:

A:传统数据分析主要是描述性分析和诊断性分析,而大数据分析主要是预测性分析。
B:大数据分析的对象是大规模类型多样的海量数据,使用的模型较为复杂;而传统数据分析则作用在有限的小规模数据集上,模型较为简单。
C:大数据分析主要是为了发现新的规律和知识,而传统数据分析主要是为了了解正在发生的事件及其原因。
D:大数据分析需要借助各种分析工具完成,而传统数据分析不需要使用其他工具。
答案: 传统数据分析主要是描述性分析和诊断性分析,而大数据分析主要是预测性分析。;
大数据分析的对象是大规模类型多样的海量数据,使用的模型较为复杂;而传统数据分析则作用在有限的小规模数据集上,模型较为简单。;
大数据分析主要是为了发现新的规律和知识,而传统数据分析主要是为了了解正在发生的事件及其原因。

4、 1、大数据目前并无统一的定义,主要是由于数据规模巨大、来源分散、格式多样,所以需要新的体系架构、技术、算法和分析方法来对这些数据进行采集、存储和关联分析,以期望能够从中抽取出隐藏的有价值的信息。

A:正确
B:错误
答案: 正确

5、 数据科学家主要负责开发、构建、测试和维护系统,比如数据库和大规模处理系统

A:正确
B:错误
答案: 错误

6、 大数据分析的目的是从类型多样的海量数据中挖掘出隐藏的有价值的信息。

A:正确
B:错误
答案: 正确

7、 大数据分析能够应用在哪些领域?
答案: 交通 医疗 足球 零售 天文 政治

第4周Python 大数据基础 第四周单元测试

1、 Python代码:r = 5 + “5”的执行结果是

A:报错
B:55
C:10
D:5
答案: 报错

2、 1. m = [1, 2, [3]]2. n = m[:] 3. n[1] = 4 4. n[2][0] = 5 5. print(m)代码的执行结果是?

A:[1,2,[5]]
B:[1,2,[3]]
C:[1,4,[3]]
D:[1,4,[5]]
答案: [1,2,[5]]

3、 1. n1 = { ‘a’:1, ‘b’:2 }2. n2 = n13. n1[‘a’] = 54. s = n1[‘a’] + n2[‘a’]5. print(s)代码的结果是?

A:10
B:5
C:6
D:7
答案: 10

4、 用python处理本机文件时,可以使用glob完成文件查找功能。下列有关glob的说法中,错误的是

A:glob为内置库,无需import即可使用
B:glob可以使用?匹配单个字符
C:glob中表达式”[0-9]”表示匹配0-9中的单个数字
D:glob返回的是一个包含所有匹配文件的列表
答案: glob为内置库,无需import即可使用

5、 1. import sqlite32. from faker import Faker3. f=Faker(“zh_cn”)4. conn=sqlite3.connect(“:memory:”)5. c=conn.cursor()6. c.execute(“create table user (id varchar(10) primary key, name varchar(20))”)7. for i in range(0,100):8. c.execute(“insert into user (id, name) values (‘{}’,'{}’)”.format(i,f.name()))9. c.execute(“select * from user”)10. result = c.fetchall()11. print(len(result))上述代码执行的结果是?

A:100
B:10
C:20
D:0
答案: 100

6、 用户处理numpy的ndarray对象时,可以改变数组维度。下列描述中错误的是

A:resize方法不能修改原andarray数组
B:reshape方法不能修改原andarray数组
C:flatten方法不能修改原andarray数组
D:参数用元组来表示
答案: resize方法不能修改原andarray数组

7、 Numpy的Series对象在进行运算时,其默认索引值是0到n-1可以参与运算,而自定义索引值不会参与运算。

A:正确
B:错误
答案: 错误

8、 DataFrame结构为一个二维结构,每一列可以为不同的值类型,但一列之内的类型必须相同。

A:正确
B:错误
答案: 正确

9、 由于Python的list列表足够强大,完全可以代替ndarry这种数组。

A:正确
B:错误
答案: 错误

10、 使用文件打开命令时,即使使用with as语句也应该调用close()方法显式关闭文件,以保证文件安全。

A:正确
B:错误
答案: 错误

第5周Python 大数据基础 第5周单元测试

1、 使用json库进行Python的内置数据类型与Json类型转换时,字典dict将被转换为

A:object
B:string
C:str
D:array
答案: object

2、 某网站提供形式多样的财经大数据服务:①提供一个第三方python库,调用库中方法可以直接返回DataFrame对象;②提供一个网站api,可以返回json格式字符串;③提供静态页面,内含表格数据;④提供查询功能,使用JavaScript动态脚本生成查询结果。假设上述各种服务样式均可返回所需数据,则从减少编程工作量的角度看,用户应选择的方案编号是

A:①
B:②
C:③
D:④
答案:

3、 对于matplotlib的plot方法原型:plt.plot([x],y,[format], …),下列说法错误的是

A:只需要提供y轴数据,即可绘制出图像
B:plt是matplotlib中的一个字库名字
C:format表示控制字符串,包括:颜色、风格和标记
D:x轴数据必须提供
答案: 只需要提供y轴数据,即可绘制出图像

4、 matplotlib提供了图形文本显示,下列函数可以在图像中任意位置显示文字的是

A:text()
B:title()
C:xlabel()
D:ylabel()
答案: text()

5、 使用Pandas处理数据的时候,经常会遇到重复值。下列说法中错误的是

A:duplicated()返回值中用1表示重复,0表示不重复
B:duplicated()用于判断某行是否存在重复
C:duplicated()返回一个Series对象
D:duplicated()不能删除重复值
答案: duplicated()返回值中用1表示重复,0表示不重复

       


如需购买完整答案,请点击下方红字:

点击这里,购买完整答案


获取更多中国大学慕课答案,请点击这里,进入mooc.mengmianren.com


 

铆毫肺瘫踢山惮佰挂持扩窖继