我可以使用regex与Python和Selenium一起找到一个元素吗
Can I find an element using regex with Python and Selenium?
我需要点击一个下拉列表,然后点击其中的隐藏元素。html将由javascript生成,我不知道id或类名,但我知道其中会有一个短语。我可以用regex找到和元素,然后用selenium点击它吗?
您不能简单地使用内置的selenium网络驱动程序定位器进行基于正则表达式的搜索,但您有多种方法可以帮助您:
-
contains()
和starts-with()
XPath函数://div[contains(., "Desired text")] //div[starts-with(., "Desired text")]
preceding
、preceding-sibling
、following
和following-sibling
轴,如果您知道需要定位的新生成元素块的相对位置,这些轴可能会对您有所帮助
还有CSS选择器用于元素属性的部分匹配:
a[href*=desiredSubstring] # contains
a[href^=desiredSubstring] # starts-with
a[href$=desiredSubstring] # ends-with
您总是可以找到比所需更多的元素,然后在Python中过滤掉它们,例如:
import re
pattern = re.compile(r"^Some 'w+ text.$")
elements = driver.find_elements_by_css_selector("div.some_class")
for element in elements:
match = pattern.match(element.text)
if match:
print(element.text)
您可以使用import re
来执行正则表达式函数。下面的代码段浏览一个表,如果行中有3个单元格,则获取第一个单元格中<b></b>
标记之间的文本
import re
from lxml import html, etree
tree = html.fromstring(browser.page_source)
party_table = tree.xpath("//table")
assert len(party_table) == 1
CURRENT_PARTIES = []
for row in party_table[0].xpath("tbody/tr"):
cells = row.xpath("td")
if len(cells) != 3:
continue
if cells[1].text == "represented by":
match = re.search(r'<b>(.+?)</b>', etree.tostring(cells[0]), re.IGNORECASE)
print "MATCH: ", match
相关文章:
- 使用clickToggle并在单击另一个元素时关闭元素
- 表追加而不附加最后一个元素
- 滚动到容器中的下一个元素-几乎到了
- 是否有一个JS/jQuery函数可以获取某个类的每个元素的ID
- 使用CSS或js,使用动态选择器选择任意li的下一个元素
- 按我自己的类克隆另一个元素的内容和顺序
- Javascript获取上一个元素的内容
- 如何通过HTML+CSS中的另一个元素Selector更改元素的属性值
- 在数组中的一个元素上设置多个值
- 指令的模板必须只有一个根元素:With restrict E&替换true
- HTML JavaScript,我如何能够通过给每个元素一个不同的Id来使用JavaScript使这个函数工作
- 如何创建一个独立的 DOM 元素?一个不从父母那里继承 css 等
- 如何给图像元素一个“;选择“;使用Raphael.js查看
- 如何显示隐藏的
- 元素一个接一个或全部同时
- 使用"span"创建一个自定义的基于web的文本编辑器;元素——一个坏主意
- 引导旋转木马传递元素一个接一个
- 给所有元素一个匹配数组内容的ID
- 我如何得到Json数组元素一个接一个的jquery上不同的id'
- 一次淡入附加元素一个
- 如何使用AngularJS检索外部网站的内容(一个元素一个元素)