使用 BeautifulSoup 从 python 中的 XML 中提取特定标签-解网

问：

我有一个元数据文件，如下所示：

<?xml version='1.0' encoding='utf-8'?>
<package xmlns="http://www.idpf.org/2007/opf" unique-identifier="uuid_id" version="2.0">
    <metadata xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:opf="http://www.idpf.org/2007/opf">
        <dc:title>Princeton Review Digital SAT Premium Prep, 2024: 4 Practice Tests + Online Flashcards + Review &amp; Tools</dc:title>
        <dc:creator opf:file-as="Princeton Review, The" opf:role="aut">The Princeton Review</dc:creator>
        <dc:identifier opf:scheme="ISBN">9780593516874</dc:identifier>
        <dc:identifier opf:scheme="AMAZON">0593516877</dc:identifier>
        <dc:identifier opf:scheme="GOODREADS">63139948</dc:identifier>
        <dc:identifier opf:scheme="GOOGLE">o6i4EAAAQBAJ</dc:identifier>
    </metadata>
</package>

我知道如何使用 BeautifulSoup 来提取像 .我正在努力如何仅提取 ISBN 字段（）。<dc.title><dc:identifier opf:scheme="ISBN">

from bs4 import BeautifulSoup

with open ('metadata.opf', 'r') as f:
    file = f.read()

metadata = BeautifulSoup(file, 'xml')
title = metadata.find('dc:title')
print(title.text)

author = metadata.find('dc:creator')
print(author.text)

# isbn = metadata.find_all('dc:identifier'). # This finds 4 fields, as expected.

如何限制它？我不能依赖字段的顺序，并且 ISBN 长度可能会有所不同。

python xml 解析 beautifulsoup

from bs4 import BeautifulSoup

with open ('metadata.opf', 'r') as f:
    file = f.read()

metadata = BeautifulSoup(file, 'xml')
title = metadata.find('dc:title')
print(title.text)

author = metadata.find('dc:creator')
print(author.text)

isbn = metadata.find('dc:identifier', attrs={"opf:scheme": "ISBN"}) # This finds 4 fields, as expected. 
print(isbn.text)

并应导致

Princeton Review Digital SAT Premium Prep, 2024: 4 Practice Tests + Online Flashcards + Review & Tools
The Princeton Review
9780593516874

https://www.crummy.com/software/BeautifulSoup/bs4/doc/#find

上一个：Enterprise Architect Sparx 系统中的复杂类型排序

下一个：空手道响应 xml 未解析，并表示不是 XML

使用 BeautifulSoup 从 python 中的 XML 中提取特定标签

Extracting specific tag from XML in python using BeautifulSoup

评论