我可以使用regex与Python和Selenium一起找到一个元素吗

Can I find an element using regex with Python and Selenium?

本文关键字:元素 一个 一起 regex 可以使 Python Selenium 我可以      更新时间:2023-09-26

我需要点击一个下拉列表,然后点击其中的隐藏元素。html将由javascript生成,我不知道id或类名,但我知道其中会有一个短语。我可以用regex找到和元素,然后用selenium点击它吗?

您不能简单地使用内置的selenium网络驱动程序定位器进行基于正则表达式的搜索,但您有多种方法可以帮助您:

  • contains()starts-with() XPath函数:

    //div[contains(., "Desired text")]
    //div[starts-with(., "Desired text")]
    
  • precedingpreceding-siblingfollowingfollowing-sibling轴,如果您知道需要定位的新生成元素块的相对位置,这些轴可能会对您有所帮助

还有CSS选择器用于元素属性的部分匹配:

a[href*=desiredSubstring]  # contains
a[href^=desiredSubstring]  # starts-with
a[href$=desiredSubstring]  # ends-with

您总是可以找到比所需更多的元素,然后在Python中过滤掉它们,例如:

import re
pattern = re.compile(r"^Some 'w+ text.$")
elements = driver.find_elements_by_css_selector("div.some_class")
for element in elements:
    match = pattern.match(element.text)
    if match:
        print(element.text)

您可以使用import re来执行正则表达式函数。下面的代码段浏览一个表,如果行中有3个单元格,则获取第一个单元格中<b></b>标记之间的文本

import re
from lxml import html, etree
tree = html.fromstring(browser.page_source)
party_table = tree.xpath("//table")
assert len(party_table) == 1
CURRENT_PARTIES = []
for row in party_table[0].xpath("tbody/tr"):
    cells = row.xpath("td")
    if len(cells) != 3:
        continue
    if cells[1].text == "represented by":
        match = re.search(r'<b>(.+?)</b>', etree.tostring(cells[0]), re.IGNORECASE)
        print "MATCH: ", match