admin 管理员组

文章数量: 887021

文章目录

  • 1. PhantomJS简介
  • 2. 下载
  • 3. 安装
  • 4. 配置环境变量
  • 5. 验证是否安装正确
  • 6. 操作PhantomJS浏览器

1. PhantomJS简介


PhantomJS 是一个基于Webkit的 “无界面” (headless)浏览器,它会把网站加载到内存并执行页面上的 JavaScript,因为不会展示图形界面,所以运行起来比完整的浏览器要高效。

如果我们把 Selenium 和 PhantomJS 结合在一起,就可以运行一个非常强大的网络爬虫了,这个爬虫可以处理 JavaScrip、Cookie、headers,以及任何我们真实用户需要做的事情。


2. 下载


Linux下载安装命令:sudo apt-get install phantomjs


官网下载地址:https://phantomjs/download.html



3. 安装


解压安装包即可:



4. 配置环境变量


1.进入到PhantomJS的根目录,点击进入bin文件夹:

2.进入到这个界面点击地址栏空白处并复制路径:



3. 找到此电脑右击选择属性:



4. 点击高级环境设置




5. 点击环境变量



6. 在下面的系统变量里面找到Path并双击



7. 点击新建



8. 把之前的复制的路径粘贴进去,后依次点击确定,配置完成



5. 验证是否安装正确


打开cmd,输入phantomjs,按回车如果结果为下图则安装正确。



6. 操作PhantomJS浏览器


操作PhantomJS浏览器打开百度:

from selenium import webdriver

# 初始化浏览器
browser = webdriver.PhantomJS()
# 发送请求
browser.get('https://www.baidu/')

# 打印页面的标题
print(browser.title)

# 退出模拟浏览器
browser.quit()  # 一定要退出!不退出会有残留进程

本文标签: 环境变量 浏览器 教程 PhantomJS