我有一个文本文件,该文件的数据不一致。像带有额外空格的名称,特殊字符等,我已删除了该名称,但无法删除两条数据行之间的空白行
f = open("sample_data.txt", "rb")
print (f.next())
for x in f:
new = re.sub('[^a-zA-Z0-9,.]', "", x)
print (new)
这是我的输入数据:
这是我得到的输出:
我要删除第11、12、14和15行
答案 0 :(得分:0)
如何检查new
是否仅在打印之前包含?这样对您有用吗?
for x in f:
new = re.sub('[^a-zA-Z0-9,.]', "", x)
if len(new.strip()) > 0:
print(new)
似乎这些行并不是真的是空的,它们的开头只有一个数字,之后没有其他内容。
如何检查腿长大于2?那应该避免打印那些开头只有数字的行。
for x in f:
new = re.sub('[^a-zA-Z0-9,.]', "", x)
if len(new.strip()) > 2:
print(new)