requests-FreeNAS中文网

admin 管理员组

文章数量: 887021

requests

分页数据的爬取-肯德基餐厅位置信息

文章目录

分页数据的爬取-肯德基餐厅位置信息
- 1 分析
- 2 爬取到一页数据
- 3 爬取多页数据

1 分析

输入地址后显示的地址和最初的地址一样

说明按下查询按钮发起的是Ajax请求

当前页面刷新出来的位置信息一定是通过ajax请求请求到的数据

.基于抓包工具定位到该ajax请求的数据包，从该数据包中捕获到：

请求的url
请求方式
请求携带的参数
看到响应数据

最初抓包的时候都是选择的ALL，但是分析出了这里发送的是Ajax请求，所以本次选择Fetch/XHR，这个是专门查看Ajax请求的

打开F12，选择Fetch/XHR，点击查询后查看结果

发现请求方式是post方式

返回值还是json格式

2 爬取到一页数据

import requestsheaders = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36'
}
url = '.ashx?op=keyword'data = {'cname': '','pid': '','keyword': '北京','pageIndex': '1','pageSize': '10',
}
# data参数是post方法中处理参数动态化的参数
response = requests.post(url=url, headers=headers, data=data)
page_text = response.json()for dic in page_text['Table1']:title = dic['storeName']addr = dic['addressDetail']print(title, addr)

3 爬取多页数据

当点击第二页的时候，发现请求的数据的pageIndex变为了2，点击第三页的时候变为了3。

所以写一个循环就可以爬取所有页面

每次循环只需要改变的是pageIndex参数的值，因为数据要求是字符串类型，所以避免出错给其强制转换一下

import requestsheaders = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36'
}
url = '.ashx?op=keyword'for page in range(1, 9):data = {'cname': '','pid': '','keyword': '北京','pageIndex': str(page),'pageSize': '10',}# data参数是post方法中处理参数动态化的参数response = requests.post(url=url, headers=headers, data=data)page_text = response.json()for dic in page_text['Table1']:title = dic['storeName']addr = dic['addressDetail']print('第', page, '页：', title, addr)

关注专栏查看更多详细内容

本文标签： requests

版权声明：本文标题：requests 内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/jishu/1716357266h679218.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

技术交流 – FreeNAS中文网

requests

requests

分页数据的爬取-肯德基餐厅位置信息

文章目录

1 分析

2 爬取到一页数据

3 爬取多页数据

更多相关文章

requests

【requests】

python系列:requests库+BS4库及综合实例

requests使用re爬取腾讯体育新闻

发表评论

推荐文章

MQTT学习记录（一、Windows）

树莓派鼠标延迟以及其它问题汇总

Windwos tar 命令详解

黑鲨重装计算机安装无法继续,黑鲨教你重装系统解决电脑开机无法进入系统问题...

最新条码标签软件 BarTender 2022 R8

热门文章

刚回应！删库报复！一行代码蒸发数10亿！

openwrt移植过程的问题记录

python 使用catboost报错： rsm on GPU is supported for pairwise modes only

黄金丧燃一刻：看支付宝如何治愈你的丧！

使用 LWUIT 的风格、主题和 Painter 特性

比未知更可怕的是预知

win7系统提示0x80070035找不到网络路径

Windows 2012 R2 搭建域控制器及win7加入域服务

Windows上MSYS2的安装和使用

Clion 2023.1.5 最新详细破解安装教程

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

Windows7 系统安全设置权限技巧

（Windows系统）详细介绍Windows系统 含有英文版

最新Windows 11教育版下载：专为教育设计的系统！

Win7系统下搭建NFS服务器

零基础使用UltraISO制作并安装纯净Win10系统指南

（Windows系统）详细介绍Windows系统含有英文版