我有一个大小为1兆字节的文本文件,其中包含一些数字字符串和一些字符长度为3,5,9,8,10的字符串。如何查找只有长度的所有数字8个字符?在找到长度为8个字符的数字后,必须提取这些数字并将其保存在此文件的extract.txt中。我怎么能这样做?
示例...
file.txt的
91664356
1665
00643
qouytyi
15790008
1567065
abcdeigf
qoiyytgxf
931467846
00851685
150033561246788
074226899
extracted.txt
91664356
15790008
15670654
00851685
答案 0 :(得分:1)
使用 -
with open('data.txt', 'r') as myfile:
data=myfile.read()
numbers = re.findall(r'\D(\d{8})\D', data)
它将捕获具有8长度的数字 - 不包含478319.3
等数字
它将输出这些数字的列表。
示例强>
让
123.32 is a good number 12 also 12345678 478319.3
是文件的内容。 输出将是 -
['12345678']
答案 1 :(得分:0)
Authorization
那么,也许这个脚本可以帮助你
12345678 123456789 1234567 abcdefg abcdefgh abcdefghi