admin 管理员组文章数量: 887021
2024年1月11日发(作者:form e产地证办理流程)
网络数据爬取与处理知到章节测试答案智慧树2023年最新上海商学院
第一章测试
1. 以下描述错误的是( )。
参考答案:
Anaconda只提供了Jupyter notebook编程环境
2. 以下描述错误的是( C)。
以下哪一项不属于数据科学的基本任务( )。
参考答案:
存储数据
3. 以下关于数据科学的说法中,正确的是( )。
参考答案:
计算工具的革新,数据量的持续增长推动了数据科学的发展。
4. 智能健康手环的运用了以下哪一项数据采集技术( )。
参考答案:
传感器
5. 下列关于大数据特点的说法中,错误的是( ).
参考答案:
数据价值密度高。
第二章测试
1. 下列选项哪不是爬虫程序的常见类型( )。
参考答案:
深层式网络爬虫
2. 以下关于实现网络爬虫程序的描述中,错误的是( )。
参考答案:
通过爬虫程序获取的数据文件均为HTML文件
3. 通过浏览器访问网站服务器的过程,描述错误的是( )。
参考答案:
TCP协议规范了超文本标记语言的语法格式
4. 下列不属于常用反爬虫手段的是( )。
参考答案:
人工筛查
5. 以下关于爬虫程序的描述中,正确的是( )。
参考答案:
爬虫程序执行时应避免对服务器造成过载
第三章测试
1. 以下关于re库的描述中,错误的是( )。
参考答案:
re库是Python的第三方库
2. 正则表达式中能够匹前面的字符或子表达式1次或多次的符号是( )。
参考答案:
+
3. 以下不能够匹配任意数字字符的正则表达式的是( )。
参考答案:
{}
4. 执行以下程序输出的结果是( D)。
import re
s='ABC123abc456'
a=l('[A-Za-z]{2}',s)
print( )
参考答案:
null
5. 执行以下程序输出的结果是( B)。
import re
s='Bob:12+Alex:23+Emily:33'
a=l('+*(.+?)+',s)
print( )
参考答案:
null
第四章测试
1. HTML 是整个网页的结构,相当于整个网站的框架。带“<”、“>”符号的都是属于 HTML 的标签,并且标签都是成对出现的。下列说法中,错误的是( )。
参考答案:
..表示该标签是标题
2. 下列关于BeautifulSoup中对象类型描述错误的是( )。
参考答案:
string属性可获取标签的id属性
3. 执行以下程序输出的结果是( )。
from bs4 import BeautifulSoup
html='
ssAlice
id="name2">Amy
'soup=BeautifulSoup(html,'')
print()
参考答案:
Alice
4. 执行以下程序输出的结果是( )。
from bs4 import BeautifulSoup
html='
ssAlice
id="name2">Amy
'soup=BeautifulSoup(html,'')
_all(name='a',id='name2')
参考答案:
[Amy]
5. 执行以下程序输出的结果是( )。
from bs4 import BeautifulSoup
html='
ssAlice
id="name2">Amy
'soup=BeautifulSoup(html,'')
('p~a')
参考答案:
[Amy]
第五章测试
1. 以下关于JSON模块描述错误的是( )。
参考答案:
( )只只能将json字符串解析为字典
2. 以下关于json数据的描述中,错误的是( )
参考答案:
JSON是非常利于人阅读,但是不太利于机器解析和生成的。
3. 表单登陆需要使用的请求方法是( )
参考答案:
POST
4. 以下关于Ajax技术描述错误的是( )
参考答案:
网络爬虫程序不能从采用Ajax技术的网页中爬取数据
5. 以下描述错误的是( )
参考答案:
可通过Ajax可实现网页的静态加载
第六章测试
1. Pandas提供的数据类型中,以下哪一项是带索引的一维数组( )。
参考答案:
Series
2. 执行以下程序输出的结果是( )。
import pandas as pd
s=([3,5,6,7,9],index=['a','b','c','d','e'])
print(list(s[2:4]))
参考答案:
[6,7]
3. 执行以下程序输出的结果是( )。
import pandas as pd
s1=([3,5,6,7,9])
s2=([1,2,3,4,1])
print((s1+s2).sum())
参考答案:
41
4. 执行以下程序输出的结果是( A )。
import pandas as pd
d={'one':[1,3,5,7],'two':[2,4,6,8]}
df=ame( )
df['three']=df['two']-df['one']
(2)
print(df)
参考答案:
5. 执行以下程序输出的结果是( A)。
import pandas as pd
d={'one':[1,3,5,7],'two':[2,4,6,8]}
df=ame( )
df['three']=df['two']-df['one']
print(df[(>3) & (<8)])
参考答案:
第七章测试
1. 关于pandas的merge方法描述错误的是( )。
参考答案:
merge方法可以将两个dataframe在行索引上对齐连接
2. 关于pandas的concat方法描述错误的是( )。
参考答案:
concat方法可以将两个dataframe在任意列上对齐连接
3. 变量df1与df3的值如下图所示,执行以下程序后,变量df的值为( )。
df=([df1,df3],axis=1,join='inner')
参考答案:
4. 变量df1与df2的值如下图所示,执行以下程序后,变量df的值为( )。
df=(df1,df2,on=['key1','key2'],how='left')
参考答案:
5. 变量df1与df2的值如下图所示,执行以下程序后,变量df的值为( )。
df=(df1,df2,on=['key1','key2'],how='right')
参考答案:
第八章测试
1. 以下描述错误的是( )。
参考答案:
apply方法可将函数功能应用到dataframe上的每一个元素
2. 以下关于缺失值的处理描述错误的是( )。
参考答案:
通过dataframe的isnull()方法可直接查询到每一列缺失值的个数
3. 变量df的值如图所示,执行以下代码后输出的结果是( )。
print(().sum().sum())
参考答案:
7
4. 变量df的值如图所示,执行以下代码后返回的结果是( )。
(thresh=3)
参考答案:
5. 变量df的值如图所示,执行以下代码后返回的结果是( )。
_duplicates(keep='last')
参考答案:
版权声明:本文标题:网络数据爬取与处理知到章节答案智慧树2023年上海商学院 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.freenas.com.cn/jishu/1704939757h467342.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论