当前位置:首页 > python > 正文内容

在Linux操作系统上使用selenium库

zhangsir4年前 (2022-08-23)python474

安装selenium模块

命令:

pip3 install selenium


安装chrome命令:

yum install https://dl.google.com/linux/direct/google-chrome-stable_current_x86_64.rpm


这个命令是下载安装最新的稳定的chrome版本,不是固定的版本,所以要注意下载chromedriver时要对应版本


查看版本

google-chrome --version


我是在本地win10系统又下了一遍,解压可以看到chrome版本是86


注:如果运行程序出错:Cannot find Chrome binary,就是没有安装chrome


安装依赖库

命令:

yum install pango.x86_64 libXcomposite.x86_64 libXcursor.x86_64 libXdamage.x86_64 libXext.x86_64 libXi.x86_64 libXtst.x86_64 cups-libs.x86_64 libXScrnSaver.x86_64 libXrandr.x86_64 GConf2.x86_64 alsa-lib.x86_64 atk.x86_64 gtk3.x86_64 -y


注:如果没有安装依赖库会报错:error while loading shared libraries: libX11.so.6:


安装chromedriver(驱动程序)


下载链接如下:点我下载,一定要找到与上面chrome版本相应的版本,这里下载和上面对应的86版本


可以windows下载后然后传到服务器上,也可以直接使用wget命令下载


命令:

wget http://chromedriver.storage.googleapis.com/index.html?path=86.0.4240.22/


然后给chromedriver 文件赋予可执行权限


命令:

chmod 777 chromedriver


然后放到环境变量PATH路径中


命令:

cp chromedriver /usr/bin/


可以查看chromedriver的版本号


命令:

chromedriver --version


selenium代码测试


在服务器上新建一个python文件,写入以下代码


#!/usr/bin/python3
#coding:utf-8
from selenium import webdriver
ch_options = webdriver.ChromeOptions()
#为Chrome配置无头模式
ch_options.add_argument("--headless")  
ch_options.add_argument('--no-sandbox')
ch_options.add_argument('--disable-gpu')
ch_options.add_argument('--disable-dev-shm-usage')
# 在启动浏览器时加入配置
dr = webdriver.Chrome(options=ch_options)
#这是测试网站
url = "https://www.baidu.com"
dr.get(url)
#打印源码
print(dr.page_source)


然后python执行这个py文件,结果打印出了源码,即selenium模块环境配置成功。


zhangsir版权c3防采集https://mianka.xyz

扫描二维码推送至手机访问。

版权声明:本文由zhangsir or zhangmaam发布,如需转载请注明出处。

本文链接:http://mianka.xyz/post/15.html

分享给朋友:

“在Linux操作系统上使用selenium库” 的相关文章

python之seleniumwire获取network(网络)信息

python之seleniumwire获取请求头参数import time from seleniumwire import webdriver # 创建Chrome驱动程序的新实例 driver = webdriver...

Python三方库ddddocr实现验证码识别

Python三方库ddddocr实现验证码识别环境要求python >= 3.8安装三方库pip install ddddocr -i https://pypi.tuna.tsinghua.edu.cn/simple参数说明:参数名参数类型默认值说明us...

python 将json数据转成csv文件

从JSON数据转化CSV文件下面的这个Python脚本能够将JSON数据转化到CSV文件的表格当中去,我们输入的是带有.json后缀的文件,输出的是.csv后缀的表格文件,代码如下import json def converter(input_file, output...

计算机学习视频教程

人工智能机器学习:Python&R实践课程介绍:https://www.aihorizon.cn/1百度网盘地址: https://pan.baidu.com/s/1a743NTKFRjsgexMTagWooA?pwd=e39j动手使用Python进行自然语言处理(NLP)课程介绍:http...

python 多线程与多进程的代码实例

一.两者区别多进程和多线程的主要区别是:线程是进程的子集(部分),一个进程可能由多个线程组成。多进程的数据是分开的、共享复杂,需要用IPC;但同步简单。多线程共享进程数据,共享简单;但同步复杂。(1)多进程进程是程序在计算机上的一次执行活动,即正在运行中的应用程序,通常称为进程。当你运行一个程序,你...

python selenium 使用代理ip

代码如下:from selenium import webdriver chromeOptions = webdriver.ChromeOptions() chromeOptions.add_argument("--proxy-serv...