技术交流 – FreeNAS中文网

FreeNAS中文网是一个编程技术交流的平台，欢迎技术员程序猿前来投稿！

扫一扫

扫一扫

首页技术总结正文内容

scrapy通过Request返回的页面数据与浏览器查看到的页面数据不一致

技术总结

更新时间：2024-12-23 02:53:05 5

admin 管理员组

文章数量: 887021

1.URL的地址可以反映请求用户所在的区域，区域不同返回的数据也不同
例如：http://www.xxxx/en/xxx 和 http://www.xxxx/cn/xxx
就可以看出不同

2.请求用户的IP地址所在的区域，如果使用代理，则返回的数据也可能不同。

3.请求头的设置不同，例如：user-agent,accept-language不同也会导致返回的数据不同。
scrapy有自己默认的scrapy相关的user-agent,且默认accept-language为en，所以返回的内容与chrome浏览器返回的内容不同。

4.chromedriver 与 Chrome浏览器的版本不一致。chromedriver下载地址，每个文件夹的notes.txt文件中都有对本版本对应chrome浏览器的说明。chromedriver下载之后需要放在/usr/local/bin下（mac）

补充：
1.可以在chrome浏览器网址输入：chrome://version/ 来查看详细的信息。

2.scrapy可以断点调试查看：response对象里面的request对象里面的headers对象的user-agent，这个是请求头，注意与响应头区分开来。

3.scrapy的请求头设置可以在setting.py文件中：

DEFAULT_REQUEST_HEADERS = {
    'accept-language': 'zh-CN,zh;q=0.8',
    'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36'
}

本文标签：页面数据浏览器 scrapy request

版权声明：本文标题：scrapy通过Request返回的页面数据与浏览器查看到的页面数据不一致内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/jishu/1726436269h960282.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

不同设备浏览器的userAgent值大全

技术总结

2月前

最近在使用jQuery进行网站产品开发，涉及到浏览器兼容性问题比较多，于是决定集中整理一下： 这里使用了js的alert(navigator.userAgent.toLowe

win8消费者预览版Chrome无法设置默认浏览器

技术总结

2月前

核心提示：在Windows 8消费者预览版中Chrome无法设置默认浏览器该怎么办?在这里就来告诉你解决的方法! 虽然说IE10很优秀，但萝卜青菜各有所爱，例如Win8迷就

苹果浏览器显示打不开改网页无法连接服务器,为什么苹果浏览器老是显示safari打不开该网页答案...

技术总结

2月前

小编在这段时间遇到好多广大网友的咨询，今天免费分享一下关于电脑系统和电脑操作教程的知识大全，这篇文字是关于为什么苹果浏览器老是显示safari打不开该网页答案的文字，欢迎大金

通过userAgent判断手机浏览器类型

技术总结

2月前

我们可以通过userAgent来判断，比如检测某些关键字，例如：AppleWebKit*****Mobile或AppleWebKit，需要注意的是有些浏

chrome浏览器必备5款插件--各个都好使--chrome基础

技术总结

2月前

办公电脑在使用固定期限后，又到了新换电脑的时候，本次新电脑到手后，在浏览器方面依然选择了已经熟悉的chrome浏览器，有一句话说的对&#xff0

python网页打不开_Python请求库有时无法打开浏览器可以打开的网站

技术总结

2月前

我有一个Python项目，我需要浏览许多站点并对其进行解析。我注意到，requests即使在Chrome和FF中打开网站的情况很好，在多个情况下，也无

更改Jupyter Notebook打开的默认浏览器（切换到Edge为例）

技术总结

1月前

✨1.进入Anaconda Prompt🎉2. 输入以下代码 jupyter notebook --generate-config可以得到 jupyter_notebook_config.py 的路径&

Windows环境下安装scrapy

技术总结

1月前

scrapy是Python开发的一个爬虫框架，很多情况下都是基于Linux系统安装，本篇将介绍windows环境下安装scrapy框架，亲测有效。 1.安装依赖直接pi

post请求跳转页面_Python post请求模拟登录淘宝并爬取商品列表！

技术总结

1月前

一、前言大概是一个月前就开始做淘宝的爬虫了，从最开始的用selenium用户配置到selenium模拟登录，再到这次的post请求模拟登录。一共是三篇博客，记录了我爬取淘宝网的经历。期间也有朋友向我提出了不少问题，比如滑块失败，微博登录失

Python数据分析案例47——笔记本电脑价格影响因素分析

技术总结

1月前

案例背景博主对电脑的价格和配置一直略有研究，正好最近也有笔记本电脑相关的数据，想着来做点分析吧，写成一个案例。基本上描述性统计，画图&#xf

局部页面切换url为什么不变_python爬虫 - 翻页url不变网页的爬虫探究

技术总结

29天前

python爬虫-翻页url不变网页的爬虫探究 url随着翻页改变的爬虫已经有非常多教程啦，这里主要记录一下我对翻页url不变网页的探究过程。学术菜鸡第一次写CSDN，请大家多多包容～如果对你有一点点帮助，请帮我点个赞吧！翻页url不变

电脑qq微信等软件可以上网，浏览器无法上网，电脑浏览器提示代理服务器连接失败

技术总结

29天前

当我们的电脑出现QQ，微信，腾讯视频等软件可以上网，但是就浏览器无法上网，的时候该怎么解决呢？这是一般电脑的浏览器打开网页时会提示

电脑硬盘坏了数据可以恢复吗？如何恢复硬盘数据？

技术总结

27天前

电脑硬盘坏了数据可以恢复吗？对于这种问题，还需要具体问题具体分析的，一般是可以恢复。硬盘损坏可以分为物理损坏和逻辑损坏两种情况： 1.逻辑损坏这

使用selenium控制已经打开的浏览器，应该如何实现。

技术总结

19天前

要使用Selenium控制一个已经打开的浏览器实例，你可以通过以下步骤实现，这里以Google Chrome浏览器为例： 步骤 1: 启动Chrome浏览器并启用远程调试首

selenium控制已经打开的chrome浏览器

技术总结

19天前

文章目录 1.启动浏览器传统方式快捷方式2.接管chrome1.启动浏览器传统方式在cmd或者pycharm的terminal启动一个chrome，并指定数据存放的路径 chrome.exe --remote-debugging-

Claude和ChatGPT到底选择谁？用真实数据对比

技术总结

15天前

关于“Claude和ChatGPT到底选择谁的问题”，如果是放到2个月前，我或许会毫不犹豫选择ChatGPT，不过最近Claude的一顿更新，让我一下子

Python—selenium实现自动打开360浏览器并自动登录社保网站

技术总结

14天前

使用selenium打开360浏览器需要一点技巧，因为360浏览器其实是Chrome的内核，所以需要先查清楚对于的内核版本，打开帮助-关于360浏览器，

Windows浏览器无法联网，提示代理服务器没有响应

技术总结

11天前

0.报错信息如下图一般都是使用VPN之后出现的1.打开IE浏览器 2.点击右上角设置点击设置–>Internet选项3.点击链接选项卡点击局域网设置，取消代理服务器的勾选&#xff

mac 完全删除 docker volume_清理 OSX 系统中的 Docker 容器、镜像与数据卷

技术总结

10天前

本站使用「署名 4.0 国际 (CC BY 4.0)」许可协议，欢迎转载、或重新修改使用，但需要注明来源。署名 4.0 国际 (CC BY 4.0) 本文作者: 苏洋创建时间: 2018年07月19日统计字数: 2595字阅读时间: 6

Windows 7安装后anaconda 命令行jupyter lab 出现404页面

技术总结

1天前

jupyter serverextension enable --py jupyterlab --userconda install -c conda-forge nodejs

发表评论

全部评论 0

暂无评论

推荐文章

SSO:Win10+CAS+SpringBoot Project(二)

开放源码的微信应用系统微微信.NET 研究开始

java技能提升方法,提升java技能的几个方法

清理Windows7通知区域的图标缓存

HIVE学习系列——windows Hadoop安装（上）

热门文章

最新文章