是否可以逐行解析文件,并在浏览行时就地编辑一行?
答案 0 :(得分:43)
是否可以逐行解析文件,并在浏览行时就地编辑一行?
可以使用备份文件进行模拟,如stdlib的fileinput
module所做的那样。
这是一个示例脚本,用于从命令行或some_condition
上给出的文件中删除不满足stdin
的行:
#!/usr/bin/env python
# grep_some_condition.py
import fileinput
for line in fileinput.input(inplace=True, backup='.bak'):
if some_condition(line):
print line, # this goes to the current file
示例:
$ python grep_some_condition.py first_file.txt second_file.txt
完成后first_file.txt
和second_file.txt
个文件只包含满足some_condition()
谓词的行。
答案 1 :(得分:5)
fileinput模块有非常难看的API,我找到了这个任务的漂亮模块 - in_place,Python 3的例子:
import in_place
with in_place.InPlace('data.txt') as file:
for line in file:
line = line.replace('test', 'testZ')
file.write(line)
与fileinput的主要区别:
答案 2 :(得分:4)
没有。您无法安全地写入您正在阅读的文件,因为您对该文件所做的任何更改都可能会覆盖您尚未阅读的内容。要安全地执行此操作,您必须将文件读入缓冲区,根据需要更新任何行,然后重新写入文件。
如果您正在逐字节替换文件中的内容(即,如果您要替换的文本与您要替换它的新字符串的长度相同),那么您可以使用它,但是它是一个黄蜂巢,所以我会省去麻烦,只需读取完整文件,替换内存中的内容(或通过临时文件),然后再写出来。
答案 3 :(得分:3)
如果您只打算执行不会更改已修改文件部分长度的本地化更改(例如,将所有字符更改为小写),那么您实际上可以动态地覆盖文件的旧内容。 / p>
为此,您可以使用file
对象的seek()
方法进行随机文件访问。
或者,您可以使用mmap
对象将整个文件视为可变字符串。请记住,mmap
对象可能会在32位CPU上的2-4 GB范围内施加最大文件大小限制,具体取决于您的操作系统及其配置。
答案 4 :(得分:0)
您必须以字符的大小来备份。假设您使用了readline
,那么您可以使用以下命令获取该行的长度并进行备份:
file.seek(offset[, whence])
设置为SEEK_CUR
,将偏移设置为-length
。
请参阅Python Docs或查看seek
的联系人页面。