ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

Python 文本处理 论语

2021-05-14 23:04:37  阅读:246  来源: 互联网

标签:论语 25 Python newline 文本处理 content range str line


1.问题描述:请编写程序,提取《论语》文档中所有原文内容,输出保存到“论语-提取版.txt”文件。输出文件格式要求:去掉文章中原文部分每行行首空格及如“1.11”等的数字标志,行尾无空格、无空行。参考格式如下(原文中括号及内部数字是对应源文件中注释项的标记):

 

 1 j=7
 2 k=0
 3 a=0
 4 b=0
 5 l=[]
 6 content=[]
 7 
 8 try:
 9     with open(r'C:\Users\DELL\Desktop\论语.txt','r',encoding='utf-8') as file1:
10         for line in file1:
11             newline=line
12             if newline[2:5] in [str(m)+'·'+str(n) for m in range(1,25) for n in range(1,25)]\
13                     or newline[2:6] in [str(m)+'·'+str(n) for m in range(1,25) for n in range(1,25)]\
14                     or newline[2:7] in [str(m)+'·'+str(n) for m in range(1,25) for n in range(1,25)]\
15                     or newline[2:8] in [str(m)+'·'+str(n) for m in range(1,25) for n in range(1,25)]:
16                 for p in [str(m)+'·'+str(n) for m in range(45,0,-1) for n in range(45,0,-1)]:
17                     if p in newline[0:9]:
18                         newline2=newline.replace(p,'')
19                         content.append(newline2)
20                         break
21 
22             else:
23                 content.append(newline)
24 
25 
26     with open(r'C:\Users\DELL\Desktop\论语改2.txt','w',encoding='utf-8') as file2:
27         for i in range(len(content)):
28 
29             if '【原文】' in content[i] and i>=b:
30 
31                 a=i
32                 k=i
33 
34                 while k!=0:
35                     if '】' in content[k+1]:
36                         b=k+1
37                         l.append([a,b])
38                         break
39                     else:
40                         k+=1
41         for m,n in l:
42             for line in content[m+1:n-1]:
43                 file2.write(line)
44 
45 
46 
47 
48 
49 except Exception as t:
50     print(t)

 

标签:论语,25,Python,newline,文本处理,content,range,str,line
来源: https://www.cnblogs.com/tlwhhy/p/14770448.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有