admin 管理员组

文章数量: 887021


2024年1月11日发(作者:form e产地证办理流程)

网络数据爬取与处理知到章节测试答案智慧树2023年最新上海商学院

第一章测试

1. 以下描述错误的是( )。

参考答案:

Anaconda只提供了Jupyter notebook编程环境

2. 以下描述错误的是( C)。

以下哪一项不属于数据科学的基本任务( )。

参考答案:

存储数据

3. 以下关于数据科学的说法中,正确的是( )。

参考答案:

计算工具的革新,数据量的持续增长推动了数据科学的发展。

4. 智能健康手环的运用了以下哪一项数据采集技术( )。

参考答案:

传感器

5. 下列关于大数据特点的说法中,错误的是( ).

参考答案:

数据价值密度高。

第二章测试

1. 下列选项哪不是爬虫程序的常见类型( )。

参考答案:

深层式网络爬虫

2. 以下关于实现网络爬虫程序的描述中,错误的是( )。

参考答案:

通过爬虫程序获取的数据文件均为HTML文件

3. 通过浏览器访问网站服务器的过程,描述错误的是( )。

参考答案:

TCP协议规范了超文本标记语言的语法格式

4. 下列不属于常用反爬虫手段的是( )。

参考答案:

人工筛查

5. 以下关于爬虫程序的描述中,正确的是( )。

参考答案:

爬虫程序执行时应避免对服务器造成过载

第三章测试

1. 以下关于re库的描述中,错误的是( )。

参考答案:

re库是Python的第三方库

2. 正则表达式中能够匹前面的字符或子表达式1次或多次的符号是( )。

参考答案:

+

3. 以下不能够匹配任意数字字符的正则表达式的是( )。

参考答案:

{}

4. 执行以下程序输出的结果是( D)。

import re

s='ABC123abc456'

a=l('[A-Za-z]{2}',s)

print( )

参考答案:

null

5. 执行以下程序输出的结果是( B)。

import re

s='Bob:12+Alex:23+Emily:33'

a=l('+*(.+?)+',s)

print( )

参考答案:

null

第四章测试

1. HTML 是整个网页的结构,相当于整个网站的框架。带“<”、“>”符号的都是属于 HTML 的标签,并且标签都是成对出现的。下列说法中,错误的是( )。

参考答案:

..表示该标签是标题

2. 下列关于BeautifulSoup中对象类型描述错误的是( )。

参考答案:

string属性可获取标签的id属性

3. 执行以下程序输出的结果是( )。

from bs4 import BeautifulSoup

html='

ssAlice

id="name2">Amy'

soup=BeautifulSoup(html,'')

print()

参考答案:

Alice

4. 执行以下程序输出的结果是( )。

from bs4 import BeautifulSoup

html='

ssAlice

id="name2">Amy'

soup=BeautifulSoup(html,'')

_all(name='a',id='name2')

参考答案:

[Amy]

5. 执行以下程序输出的结果是( )。

from bs4 import BeautifulSoup

html='

ssAlice

id="name2">Amy'

soup=BeautifulSoup(html,'')

('p~a')

参考答案:

[Amy]

第五章测试

1. 以下关于JSON模块描述错误的是( )。

参考答案:

( )只只能将json字符串解析为字典

2. 以下关于json数据的描述中,错误的是( )

参考答案:

JSON是非常利于人阅读,但是不太利于机器解析和生成的。

3. 表单登陆需要使用的请求方法是( )

参考答案:

POST

4. 以下关于Ajax技术描述错误的是( )

参考答案:

网络爬虫程序不能从采用Ajax技术的网页中爬取数据

5. 以下描述错误的是( )

参考答案:

可通过Ajax可实现网页的静态加载

第六章测试

1. Pandas提供的数据类型中,以下哪一项是带索引的一维数组( )。

参考答案:

Series

2. 执行以下程序输出的结果是( )。

import pandas as pd

s=([3,5,6,7,9],index=['a','b','c','d','e'])

print(list(s[2:4]))

参考答案:

[6,7]

3. 执行以下程序输出的结果是( )。

import pandas as pd

s1=([3,5,6,7,9])

s2=([1,2,3,4,1])

print((s1+s2).sum())

参考答案:

41

4. 执行以下程序输出的结果是( A )。

import pandas as pd

d={'one':[1,3,5,7],'two':[2,4,6,8]}

df=ame( )

df['three']=df['two']-df['one']

(2)

print(df)

参考答案:

5. 执行以下程序输出的结果是( A)。

import pandas as pd

d={'one':[1,3,5,7],'two':[2,4,6,8]}

df=ame( )

df['three']=df['two']-df['one']

print(df[(>3) & (<8)])

参考答案:

第七章测试

1. 关于pandas的merge方法描述错误的是( )。

参考答案:

merge方法可以将两个dataframe在行索引上对齐连接

2. 关于pandas的concat方法描述错误的是( )。

参考答案:

concat方法可以将两个dataframe在任意列上对齐连接

3. 变量df1与df3的值如下图所示,执行以下程序后,变量df的值为( )。

df=([df1,df3],axis=1,join='inner')

参考答案:

4. 变量df1与df2的值如下图所示,执行以下程序后,变量df的值为( )。

df=(df1,df2,on=['key1','key2'],how='left')

参考答案:

5. 变量df1与df2的值如下图所示,执行以下程序后,变量df的值为( )。

df=(df1,df2,on=['key1','key2'],how='right')

参考答案:

第八章测试

1. 以下描述错误的是( )。

参考答案:

apply方法可将函数功能应用到dataframe上的每一个元素

2. 以下关于缺失值的处理描述错误的是( )。

参考答案:

通过dataframe的isnull()方法可直接查询到每一列缺失值的个数

3. 变量df的值如图所示,执行以下代码后输出的结果是( )。

print(().sum().sum())

参考答案:

7

4. 变量df的值如图所示,执行以下代码后返回的结果是( )。

(thresh=3)

参考答案:

5. 变量df的值如图所示,执行以下代码后返回的结果是( )。

_duplicates(keep='last')

参考答案:


本文标签: 程序 数据 描述 错误 爬虫