PythonでXPathをイテレートする方法について説明します。XPathはXML文書を検索するための言語で、Webスクレイピングにおいて非常に有用です。
方法1: find_elements_by_xpath
を使用する
この方法では、find_elements_by_xpath
メソッドを使用して、特定のXPathに一致するすべての要素を取得します。その後、これらの要素をイテレートして必要なデータを抽出します。
elements = driver.find_elements_by_xpath('/html/body/div[1]/table[3]/tbody/tr')
for e in elements:
e.find_element_by_xpath(".//td[3]/a")
方法2: XPathの変数をループする
この方法では、XPathの変数をループして各要素を取得します。
search_results=[]
for i in range(1,11): # 10 results in a page
result=driver.find_element_by_xpath("//a[not((//div[contains(@class,'s')]//div[contains(@class,'kv')]//cite)[%s])]|((//div[contains(@class,'s')]//div[contains(@class,'kv')]//cite)[%s])"%(i,i)).text
search_results.append(result)
これらの方法を使用すると、PythonでXPathを効率的にイテレートすることができます。具体的な要件に応じて、これらの方法を適宜調整して使用してください。