Question

我正在尝试在python中就地编辑文本文件。它非常大（因此无法将其加载到内存中）。我打算替换我在里面找到的逐字节字符串。

with f as open("filename.txt", "r+b"):
    if f.read(8) == "01234567":
        f.seek(-8, 1)
        f.write("87654321")

然而，当我尝试时，write（）操作会添加到文件的末尾：

>>> n.read()
'sdf'
>>> n.read(1)
''
>>> n.seek(0,0)
>>> n.read(1)
's'
>>> n.read(1)
'd'
>>> n.write("sdf")
>>> n.read(1)
''
>>> n.seek(0,0)
>>> n.read()
'sdfsdf'
`

我希望结果为sdsdf。

Answer 1

当将读写模式流从读取模式切换到写入模式时，原始ANSI / ISO C标准需要搜索操作，反之亦然。此限制仍然存在，例如，n1570包含以下文字：

当使用更新模式（'+'作为上述模式参数值列表中的第二个或第三个字符）打开文件时，可以在关联的流上执行输入和输出。但是，如果没有对fflush函数或文件定位函数（fseek，fsetpos或rewind）的干预调用，输出不应直接输入，并且除非输入操作遇到文件结束，否则输入不应直接跟随输出而不插入文件定位功能。在某些实现中，打开（或创建）具有更新模式的文本文件可以改为打开（或创建）二进制流。

无论出于何种原因，这个限制已被导入Python，¹，即使Python包装器可以自动处理它。

对于它的价值，原始ANSI C限制的原因是许多基于Unix的系统上的低预算实现：它们为每个流保留了一个＆＃34;当前字节数＆＃ 34;和＆＃34;当前指针＆＃34;。如果宏化getc和putc操作必须调用底层实现，则当前字节计数为0，这可以检查流是否在更新模式下打开并根据需要进行切换。但是一旦你成功获得了一个字符，计数器就会保留可以继续从底层流中读取的字符数;一旦你成功写了一个字符，计数器就会保存允许添加字符的缓冲区位置数。

这意味着，如果您成功填充了内部缓冲区的getc，但后面跟着putc，那么＆＃34;写入＆＃34;来自putc的字符只会覆盖缓冲的数据。如果您有一个成功的putc但后面有一个执行不佳的getc，您会看到缓冲区中的未设置值。

这个问题很容易解决（只需提供单独的输入和输出计数器，其中一个总是为零，并且具有对模式切换实现缓冲区重新填充检查的功能）。

¹需要引用： - ）

Answer 2

您可以查看以下代码的区别：

>>> f = open("file.txt", "r+b")
>>> f.read(1)
's'
>>> f.read(1)
'd'
>>> f.seek(2)
>>> f.write("sdf")
>>> f.seek(0)
>>> f.read()
'sdsdf'

.write的指针最初位于文件的末尾。只有.seek（）会改变它的位置，但不会改变.read（）。所以你必须在写入字节之前调用.seek（）。以下代码效果很好：

500 ReferenceError: localStorage is not defined

Python就地在任意位置写入文件

2 个答案: