我正在使用带xpath的lxml来解析epub3,xhtml内容文件.
我想选择属性为epub的所有li节点:type =“footnote”
例如
<li epub:type="footnote" id="fn14"> ... </li>
我找不到合适的xpath表达式.
表达方式
//*[self::li][@id]
选择具有属性id的所有li节点,但是当我尝试时
//*[self::li][@epub:type]
我收到了错误
lxml.etree.XPathEvalError: Undefined namespace prefix
XML是
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html>
<html xmlns="http://www.w3.org/1999/xhtml" xmlns:epub="http://www.idpf.org/2007/ops">
<head>
<meta charset="utf-8" />
<link rel="stylesheet" href="stylesheet.css" />
</head>
<body>
<section class="footnotes">
<hr />
<ol>
<li id="fn1" epub:type="footnote">
<p>See foo</p>
</li>
</ol>
</section>
</body>
</html>
关于如何编写正确表达式的任何建议?
解决方法:
您是否已将名称空间前缀epub声明为lxml?
>>> tree.getroot().xpath(
... "//li[@epub:type = 'footnote']",
... namespaces={'epub':'http://www.idpf.org/2007/ops'}
... )
每个问题更新更新
XHTML命名空间也让你沮丧.尝试:
>>> tree.getroot().xpath(
... "//xhtml:li[@epub:type = 'footnote']",
... namespaces={'epub':'http://www.idpf.org/2007/ops', 'xhtml': 'http://www.w3.org/1999/xhtml'}
... )
标签:python,xpath,lxml,epub3 来源: https://codeday.me/bug/20190830/1770948.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。