ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

python-docx删除段落(含回车符)v202111211833

2021-11-21 19:00:19  阅读:306  来源: 互联网

标签:docx python text filename 回车符 doc Document CT


"""python-docx删除段落(含回车符)v202111211833
工作中需要把微信收藏文章复制到docx(仅保留文本),会出现空行及
不需要的单行,于是试写了如次代码。
"""
import pathlib
from docx import Document

docx = Document()
paths = pathlib.Path("d:\\sucai").rglob("*.docx")#限定扩展名以免运行出错
for path in paths:
    doc = Document(path)
    filename = doc.paragraphs[0].text
    for p in doc.paragraphs:
        # 以下3行代码删除小于50个字符的行(含空行)
        if len(p.text) < 50 and p.text != filename:
            CT_P = p._element
            CT_P.getparent().remove(CT_P)
    doc.save('d:\\sucai\\' + filename + '.docx')

标签:docx,python,text,filename,回车符,doc,Document,CT
来源: https://blog.csdn.net/gqtfnnz/article/details/121457662

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有