详解Selenium 元素定位和WebDriver常用方法

(编辑：jimmy 日期: 2024/11/20 浏览：3 次 )

一、定位元素的8种方式

1、方法介绍

定位一个元素定位多个元素含义 find_element_by_id() find_elements_by_id() 通过元素id定位 find_element_by_name() find_elements_by_name() 通过元素name定位 find_element_by_xpath() find_elements_by_xpath() 通过xpath表达式定位 find_element_by_link_text() find_elements_by_link_text() 通过完整超链接定位 find_element_by_partial_link_text() find_elements_by_partial_link_text() 通过部分链接定位 find_element_by_tag_name() find_elements_by_tag_name() 通过标签定位 find_element_by_class_name() find_elements_by_class_name() 通过类名进行定位 find_elements_by_css_selector() find_elements_by_css_selector()

2、实例演示

from selenium import webdriver

driver = webdriver.Chrome()
driver.get('https://www.baidu.com/')

#通过元素id定位（）
driver.find_element_by_id('kw')

#通过元素name定位
driver.find_element_by_name('wd')

#通过类名进行定位
driver.find_element_by_class_name('s_ipt')

#通过标签定位
driver.find_element_by_tag_name('input')

#通过xpath表达式定位
driver.find_element_by_xpath('//*[@id="kw"]')

#通过css选择器进行定位
driver.find_element_by_css_selector('#kw')

#通过完整超链接定位
driver.find_element_by_link_text('新闻')

#通过部分链接定位
driver.find_element_by_partial_link_text('hao')

driver.quit()#关闭所有标签页

关于xpaht和css的定位比较复杂，请参考：

XPath获取方法
XPath语法
CSS选择器语法

此处定位可能无法直接查看效果（打印结果为获取的元素对象）
定位一般都配合一些常用方法使用
上述实例中都是单个元素定位，多个元素定位关键字请参考上边的方法介绍

二、WebDriver常用方法（配合定位方法使用）

1.点击和输入

clear()：清除文本，大多数用于输入框
send_keys ()：模拟按键输入，大多数用于输入框
click()：单击元素，用处比较广泛

更多鼠标键盘事件请参考：
Python爬虫 - Selenium（5）鼠标事件
Python爬虫 - Selenium（6）键盘事件

from selenium import webdriver
import time

driver = webdriver.Chrome()

driver.get('https://www.baidu.com/')

driver.find_element_by_id("kw").clear()
driver.find_element_by_id("kw").send_keys("程序猿杂记")
driver.find_element_by_id("su").click()
time.sleep(5)

driver.quit() # 关闭所有标签页

3.提交

submit()：用于提交表单，相当于回车，应用范围远不及 click()广泛

from selenium import webdriver
import time

driver = webdriver.Chrome()

driver.get('https://www.baidu.com/')

driver_id = driver.find_element_by_id("kw")
driver_id.send_keys("程序猿杂记")
driver_id.submit()
time.sleep(5)

driver.quit() # 关闭所有标签页

4.获取一些内容

title：获得当前页面的标题
current_url：用户获得当前页面的URL
size：获取元素的尺寸
text：获取元素的文本
get_attribute()：获得属性值
is_displayed()：该元素是否用户可见

from selenium import webdriver

driver = webdriver.Chrome()

driver.get('https://www.baidu.com/')

# 获取当前页面的title
title = driver.title
print(title)

#获取当前页的url
url = driver.current_url
print(url)

# 获得输入框的尺寸
input_size = driver.find_element_by_id('kw').size
print(input_size)

# 返回百度页面底部备案信息
text = driver.find_element_by_id("cp").text
print(text)

# 返回元素的属性值， 可以是 id、 name、 type 或其他任意属性
attribute = driver.find_element_by_id("kw").get_attribute('type')
print(attribute)

# 返回元素的结果是否可见， 返回结果为 True 或 False
result = driver.find_element_by_id("kw").is_displayed()
print(result)

driver.quit() # 关闭所有标签页

Selenium文集传送门：

标题简介 Python爬虫 - Selenium（1）安装和简单使用详细介绍Selenium的依赖环境在Windows和Centos7上的安装及简单使用 Python爬虫 - Selenium（2）元素定位和WebDriver常用方法详细介绍定位元素的8种方式并配合点击和输入、提交、获取断言信息等方法的使用 Python爬虫 - Selenium（3）控制浏览器的常用方法详细介绍自定义浏览器窗口大小或全屏、控制浏览器后退、前进、刷新浏览器等方法的使用 Python爬虫 - Selenium（4）配置启动项参数详细介绍Selenium启动项参数的配置，其中包括无界面模式、浏览器窗口大小设置、浏览器User-Agent (请求头)等等 Python爬虫 - Selenium（5）鼠标事件详细介绍鼠标右击、双击、拖动、鼠标悬停等方法的使用 Python爬虫 - Selenium（6）键盘事件详细介绍键盘的操作，几乎包含所有常用按键以及组合键 Python爬虫 - Selenium（7）多窗口切换详细介绍Selenium是如何实现在不同的窗口之间自由切换 Python爬虫 - Selenium（8）frame/iframe表单嵌套页面详细介绍如何从当前定位的主体切换为frame/iframe表单的内嵌页面中 Python爬虫 - Selenium（9）警告框(弹窗)处理详细介绍如何定位并处理多类警告弹窗 Python爬虫 - Selenium（10）下拉框处理详细介绍如何灵活的定位并处理下拉框 Python爬虫 - Selenium（11）文件上传详细介绍如何优雅的通过send_keys()指定文件进行上传 Python爬虫 - Selenium（12）获取登录Cookies，并添加Cookies自动登录详细介绍如何获取Cookies和使用Cookies进行自动登录 Python爬虫 - Selenium（13）设置元素等待详细介绍如何优雅的设置元素等待时间，防止程序运行过快而导致元素定位失败 Python爬虫 - Selenium（14）窗口截图详细介绍如何使用窗口截图 Python爬虫 - Selenium（15）关闭浏览器详细介绍两种关闭窗口的区别

上一篇：浅谈Selenium 控制浏览器的常用方法
下一篇：Selenium 安装和简单使用的实现