Pythonでは、XMLの階層解析を行うために、lxml
とxml.etree.ElementTree
という2つの主要なライブラリが利用できます。
lxmlライブラリ
lxml
は、高速でパワフルなサードパーティ製のXML処理ライブラリです。XPathを使用してXMLの階層を取得することができます。以下に、lxml
を使用したXMLの階層解析の基本的なコードを示します。
import lxml.etree as ET
tree = ET.parse("example.xml")
root = tree.getroot()
elements = root.xpath("//parent/child")
for element in elements:
print(element.text)
このコードでは、example.xml
というXMLファイルを読み込み、parent
要素の下にあるchild
要素を取得しています。
xml.etree.ElementTreeライブラリ
xml.etree.ElementTree
は、Pythonの標準ライブラリであり、シンプルなAPIを提供しています。以下に、xml.etree.ElementTree
を使用したXMLの階層解析の基本的なコードを示します。
import xml.etree.ElementTree as ET
tree = ET.parse('sample.xml')
root = tree.getroot()
for child in root:
print(child.tag, child.attrib)
このコードでは、sample.xml
というXMLファイルを解析し、ルート要素の下にあるすべての子要素のタグ名と属性を表示しています。
以上がPythonでXMLの階層解析を行う基本的な方法です。これらのライブラリを適切に使用することで、XMLデータの階層構造を効果的に解析することができます。