首页技术总结正文内容

网络数据爬取与处理知到章节答案智慧树2023年上海商学院

技术总结

更新时间：2024-12-23 08:46:41 74

admin 管理员组

文章数量: 887021

2024年1月11日发(作者：form e产地证办理流程)

网络数据爬取与处理知到章节测试答案智慧树2023年最新上海商学院

第一章测试

1. 以下描述错误的是（）。

参考答案:

Anaconda只提供了Jupyter notebook编程环境

2. 以下描述错误的是（ C）。

以下哪一项不属于数据科学的基本任务（）。

参考答案:

存储数据

3. 以下关于数据科学的说法中，正确的是（）。

参考答案:

计算工具的革新，数据量的持续增长推动了数据科学的发展。

4. 智能健康手环的运用了以下哪一项数据采集技术（）。

参考答案:

传感器

5. 下列关于大数据特点的说法中，错误的是（）.

参考答案:

数据价值密度高。

第二章测试

1. 下列选项哪不是爬虫程序的常见类型（）。

参考答案:

深层式网络爬虫

2. 以下关于实现网络爬虫程序的描述中，错误的是（）。

参考答案:

通过爬虫程序获取的数据文件均为HTML文件

3. 通过浏览器访问网站服务器的过程，描述错误的是（）。

参考答案:

TCP协议规范了超文本标记语言的语法格式

4. 下列不属于常用反爬虫手段的是（）。

参考答案:

人工筛查

5. 以下关于爬虫程序的描述中，正确的是（）。

参考答案:

爬虫程序执行时应避免对服务器造成过载

第三章测试

1. 以下关于re库的描述中，错误的是（）。

参考答案:

re库是Python的第三方库

2. 正则表达式中能够匹前面的字符或子表达式1次或多次的符号是（）。

参考答案:

3. 以下不能够匹配任意数字字符的正则表达式的是（）。

参考答案:

{}

4. 执行以下程序输出的结果是（ D）。

import re

s='ABC123abc456'

a=l('[A-Za-z]{2}',s)

print（）

参考答案:

null

5. 执行以下程序输出的结果是（ B）。

import re

s='Bob:12+Alex:23+Emily:33'

a=l('+*(.+?)+',s)

print（）

参考答案:

null

第四章测试

1. HTML 是整个网页的结构，相当于整个网站的框架。带“＜”、“＞”符号的都是属于 HTML 的标签，并且标签都是成对出现的。下列说法中，错误的是（）。

参考答案:

..表示该标签是标题

2. 下列关于BeautifulSoup中对象类型描述错误的是（）。

参考答案:

string属性可获取标签的id属性

3. 执行以下程序输出的结果是（）。

from bs4 import BeautifulSoup

html='

ssAlice

id="name2">Amy'

soup=BeautifulSoup(html,'')

print()

参考答案:

Alice

4. 执行以下程序输出的结果是（）。

from bs4 import BeautifulSoup

html='

ssAlice

id="name2">Amy'

soup=BeautifulSoup(html,'')

_all(name='a',id='name2')

参考答案:

[Amy]

5. 执行以下程序输出的结果是（）。

from bs4 import BeautifulSoup

html='

ssAlice

id="name2">Amy'

soup=BeautifulSoup(html,'')

('p~a')

参考答案:

[Amy]

第五章测试

1. 以下关于JSON模块描述错误的是（）。

参考答案:

( )只只能将json字符串解析为字典

2. 以下关于json数据的描述中，错误的是（）

参考答案:

JSON是非常利于人阅读，但是不太利于机器解析和生成的。

3. 表单登陆需要使用的请求方法是（）

参考答案:

POST

4. 以下关于Ajax技术描述错误的是（）

参考答案:

网络爬虫程序不能从采用Ajax技术的网页中爬取数据

5. 以下描述错误的是（）

参考答案:

可通过Ajax可实现网页的静态加载

第六章测试

1. Pandas提供的数据类型中，以下哪一项是带索引的一维数组（）。

参考答案:

Series

2. 执行以下程序输出的结果是（）。

import pandas as pd

s=([3,5,6,7,9],index=['a','b','c','d','e'])

print(list(s[2:4]))

参考答案:

[6,7]

3. 执行以下程序输出的结果是（）。

import pandas as pd

s1=([3,5,6,7,9])

s2=([1,2,3,4,1])

print((s1+s2).sum())

参考答案:

4. 执行以下程序输出的结果是（ A ）。

import pandas as pd

d={'one':[1,3,5,7],'two':[2,4,6,8]}

df=ame（）

df['three']=df['two']-df['one']

(2)

print(df)

参考答案:

5. 执行以下程序输出的结果是（ A）。

import pandas as pd

d={'one':[1,3,5,7],'two':[2,4,6,8]}

df=ame（）

df['three']=df['two']-df['one']

print(df[(>3) & (<8)])

参考答案:

第七章测试

1. 关于pandas的merge方法描述错误的是（）。

参考答案:

merge方法可以将两个dataframe在行索引上对齐连接

2. 关于pandas的concat方法描述错误的是（）。

参考答案:

concat方法可以将两个dataframe在任意列上对齐连接

3. 变量df1与df3的值如下图所示，执行以下程序后，变量df的值为（）。

df=([df1,df3],axis=1,join='inner')

参考答案:

4. 变量df1与df2的值如下图所示，执行以下程序后，变量df的值为（）。

df=(df1,df2,on=['key1','key2'],how='left')

参考答案:

5. 变量df1与df2的值如下图所示，执行以下程序后，变量df的值为（）。

df=(df1,df2,on=['key1','key2'],how='right')

参考答案:

第八章测试

1. 以下描述错误的是（）。

参考答案:

apply方法可将函数功能应用到dataframe上的每一个元素

2. 以下关于缺失值的处理描述错误的是（）。

参考答案:

通过dataframe的isnull()方法可直接查询到每一列缺失值的个数

3. 变量df的值如图所示，执行以下代码后输出的结果是（）。

print(().sum().sum())

参考答案:

4. 变量df的值如图所示，执行以下代码后返回的结果是（）。

(thresh=3)

参考答案:

5. 变量df的值如图所示，执行以下代码后返回的结果是（）。

_duplicates(keep='last')

参考答案:

本文标签：程序数据描述错误爬虫

版权声明：本文标题：网络数据爬取与处理知到章节答案智慧树2023年上海商学院内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/jishu/1704939757h467342.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。