标签:python performance benchmark coreutils sort
我编写了以下脚本来测试Python的排序功能的速度:
from sys import stdin, stdout
lines = list(stdin)
lines.sort()
stdout.writelines(lines)
然后我将其与包含1000万行的文件的coreutils sort命令进行了比较:
$time python sort.py <numbers.txt >s1.txt
real 0m16.707s
user 0m16.288s
sys 0m0.420s
$time sort <numbers.txt >s2.txt
real 0m45.141s
user 2m28.304s
sys 0m0.380s
内置命令使用了所有四个CPU(Python只使用了一个),但运行时间大约是3倍!是什么赋予了?
我使用的是Ubuntu 12.04.5(32位),Python 2.7.3和排序8.13
解决方法:
Izkata’s comment揭示了答案:特定于语言环境的比较. sort命令使用环境指示的语言环境,而Python默认使用字节顺序比较.比较UTF-8字符串比比较字节字符串更难.
$time (LC_ALL=C sort <numbers.txt >s2.txt)
real 0m5.485s
user 0m14.028s
sys 0m0.404s
那个怎么样.
标签:python,performance,benchmark,coreutils,sort 来源: https://codeday.me/bug/20190808/1624871.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。