当前位置：首页 > python > 正文内容

用python写个selenium爬虫

zhangsir3年前 (2023-03-29)python312

下面是一个使用Python和Selenium的基本爬虫示例。这个爬虫将打开谷歌浏览器并访问一个指定的网站，然后提取特定元素的信息并打印出来。

首先，您需要安装Selenium和ChromeDriver。您可以使用以下命令安装它们：

pip install selenium

接下来，您需要下载适用于您的Chrome浏览器版本的ChromeDriver。您可以在此处下载：http://chromedriver.chromium.org/downloads

下载完成后，将ChromeDriver.exe文件放在您的工作目录下或添加到系统PATH中。

下面是代码示例：

from selenium import webdriver
from selenium.webdriver.common.by import By

# 初始化ChromeDriver
driver = webdriver.Chrome()

# 打开要爬取的网站
driver.get("https://www.example.com")

# 找到特定元素并提取信息
element = driver.find_element(By.XPATH, "//h1")
print(element.text)

# 关闭浏览器
driver.quit()

这个示例将打开谷歌浏览器并访问https://www.example.com。然后，它将查找网站上的第一个`<h1>`元素并将其文本打印到控制台中。最后，它将关闭浏览器。

您可以根据自己的需要修改这个示例。例如，您可以使用不同的浏览器，找到不同的元素或在找到元素后执行其他操作。

zhangsir版权a1防采集https://mianka.xyz

扫描二维码推送至手机访问。

本文链接：https://mianka.xyz/post/153.html

分享给朋友：

返回列表

上一篇：用python写个rsa公钥解密

下一篇：python 字符串写入文件

“用python写个selenium爬虫” 的相关文章

django框架的安装和创建第一个项目

安装Djangopip install -i https://pypi.douban.com/simple django创建项目django-admin startproject 项目名称例如 django-admin startproje...

Python三方库ddddocr实现验证码识别

Python三方库ddddocr实现验证码识别环境要求python >= 3.8安装三方库pip install ddddocr -i https://pypi.tuna.tsinghua.edu.cn/simple参数说明：参数名参数类型默认值说明us...

解决Django的request.POST获取不到请求参数的问题

这个是Django自身的问题：只要在请求头的添加"content-type":'application/x-www-form-urlencoded'就行。...

python selenium 使用代理ip

代码如下：from selenium import webdriver chromeOptions = webdriver.ChromeOptions() chromeOptions.add_argument("--proxy-serv...

Linux系统下使用Python+selenium+谷歌浏览器下载文件

from seleniumwire import webdriver import time ch_options = webdriver.ChromeOptions() ch_options.add_argument("-...

python 实现快速扣背景图功能

一，实现快速扣背景图需要rembg这个三方库#引入rembg库 from rembg import remove #素材 input_path = 'input.jpg' #效果 output_path =&nbs...

用python写个selenium爬虫

“用python写个selenium爬虫” 的相关文章

django框架的安装和创建第一个项目

Python三方库ddddocr实现验证码识别

解决Django的request.POST获取不到请求参数的问题

python selenium 使用代理ip

Linux系统下使用Python+selenium+谷歌浏览器下载文件

python 实现快速扣背景图功能

Copyright My WebSite.Some Rights Reserved.