我有一个文本文件,其中包含一些不同类型的数字:整数,二进制和浮点数。我想只匹配浮点数并用点替换逗号。
我的文本文件示例(订单是随意的):
1000101 33434,34 1992 [3,41,4,5]
转换后:
1000101 33434.34 1992 [3,41,4,5]
我的代码是:
lines = []
in_file = open("input.txt", "r")
for line in in_file:
line = line.split(" ")
for x in line:
try:
if isinstance(float(x.replace(',', '.')), float):
line[line.index(x)] = float(x.replace(',', '.'))
except:
pass
lines.append(line)
in_file.close()
但是这会将所有其他数据转换为浮动,那么解决此问题的最佳方法是什么?
我想使用regex
但我不知道如何在python中做到这一点。
答案 0 :(得分:3)
另一种方法,也使用正则表达式:
import re
with open('input.txt', 'r+') as f:
newf = re.sub(r'(\s+[+-]?[0-9]+),([0-9]+\s+)',r'\1.\2', f.read())
f.seek(0)
f.write(newf)
测试文件:
1000101 33434,34 1992 [3,41,4,5]
12,43 129012 91 [1,2]
1000101 33434,34 1992 [3, 41,4,5]
结果:
1000101 33434.34 1992 [3,41,4,5]
12.43 129012 91 [1,2]
1000101 33434.34 1992 [3, 41,4,5]
答案 1 :(得分:1)
试试这个:
import re
from ast import literal_eval
FLOAT_RE = re.compile('^\d+,\d+$')
lines = []
with open("input.txt", "r") as in_file:
for line in in_file:
line = line.strip().split(" ")
for x in line:
i = line.index(x)
if FLOAT_RE.match(x):
x = x.replace(',', '.')
line[i] = literal_eval(x)
lines.append(line)
print lines
答案 2 :(得分:1)
这应该适合你:
lines = []
in_file = open("input.txt", "r")
for line in in_file:
line = line.split(" ")
for x in line:
tmp = eval(x)
if isinstance(tmp, tuple):
line[line.index(x)] = float(float(x.replace(',', '.')))
else:
line[line.index(x)] = tmp
lines.append(line)
in_file.close()
它会将所有内容转换为正确的类型
答案 3 :(得分:0)
如果您的所有字符串都采用相同的格式,则只能将第一次出现的,
放在一起:
s = "1000101 33434,34 1992 [3,41,4,5]"
print re.sub(",",".",s,1)
1000101 33434.34 1992 [3,41,4,5]