ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

python – pyparsing – 解析xml注释

2019-06-21 06:53:59  阅读:305  来源: 互联网

标签:python grammar xml-comments pyparsing


我需要解析包含xml注释的文件.具体来说,它是使用MS ///约定的c#文件.

从这个我需要拉出foobar,或者/// foobar也是可以接受的. (注意 – 如果你将xml全部放在一行上,这仍然不起作用……)

testStr = """
    ///<summary>
    /// foobar
    ///</summary>
    """

这是我有的:

import pyparsing as pp

_eol = pp.Literal("\n").suppress()
_cPoundOpenXmlComment = Suppress('///<summary>') + pp.SkipTo(_eol)
_cPoundCloseXmlComment = Suppress('///</summary>') + pp.SkipTo(_eol)
_xmlCommentTxt = ~_cPoundCloseXmlComment + pp.SkipTo(_eol)
xmlComment = _cPoundOpenXmlComment + pp.OneOrMore(_xmlCommentTxt) + _cPoundCloseXmlComment

match = xmlComment.scanString(testStr)

并输出:

for item,start,stop in match:
    for entry in item:
        print(entry)

但是我在跨多线工作的语法方面没有取得多大成功.

(注意 – 我在python 3.2中测试了上面的示例;它可以工作但是(根据我的问题)不打印任何值)

谢谢!

解决方法:

如何使用nestedExpr:

import pyparsing as pp

text = '''\
///<summary>
/// foobar
///</summary>
blah blah
///<summary> /// bar ///</summary>
///<summary>  ///<summary> /// baz  ///</summary> ///</summary>    
'''

comment=pp.nestedExpr("///<summary>","///</summary>")
for match in comment.searchString(text):
    print(match)
    # [['///', 'foobar']]
    # [['///', 'bar']]
    # [[['///', 'baz']]]

标签:python,grammar,xml-comments,pyparsing
来源: https://codeday.me/bug/20190621/1252758.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有