有谁知道文本文件中的^ Z符号代表什么以及我如何去清理它(regex / python?)。
示例字符串:
5411 Grocery Stores,www.sentryfoods.com,WI,6am ^Z 11pm 7 days a week
如何在vim中使用regex找到这个或者使用下面的python命令来处理?
df['col1'].apply(lambda x: re.sub('[^a-zA-Z]', '', x))
答案 0 :(得分:2)
您可以在Python中使用\x1a
或chr(26)
的字符串中表示它,因此您可以执行s.replace("\x1a", "")
之类的操作。它的实际含义取决于文件类型(例如,当管道,制表符,逗号等因任何原因无法工作时,Ctrl-A有时用作字段分隔符。)
答案 1 :(得分:0)
^Z
是<C-z>
。您可以通过按 Ctrl V 然后 Ctrl Z 将其插入命令行。在Vim的表示法中,那将是<C-v><C-z>
所以......
:%s/<C-v><C-z>/foo/g
会将^Z
替换为foo
。
答案 2 :(得分:0)
我的尝试 - 但需要删除空间。
re.sub('\^Z', '', x)