用逗号匹配浮点数,然后用点替换逗号?

时间:2014-06-25 19:39:29

标签: python regex python-2.7

我有一个文本文件,其中包含一些不同类型的数字:整数,二进制和浮点数。我想只匹配浮点数并用点替换逗号。

我的文本文件示例(订单是随意的):

1000101 33434,34 1992 [3,41,4,5] 
转换后

1000101 33434.34 1992 [3,41,4,5] 

我的代码是:

lines = []
in_file = open("input.txt", "r")
for line in in_file:
    line = line.split(" ")
    for x in line:
        try:
            if isinstance(float(x.replace(',', '.')), float):
                line[line.index(x)] = float(x.replace(',', '.'))
        except:
            pass
    lines.append(line)
in_file.close()

但是这会将所有其他数据转换为浮动,那么解决此问题的最佳方法是什么? 我想使用regex但我不知道如何在python中做到这一点。

4 个答案:

答案 0 :(得分:3)

另一种方法,也使用正则表达式:

import re
with open('input.txt', 'r+') as f:
    newf = re.sub(r'(\s+[+-]?[0-9]+),([0-9]+\s+)',r'\1.\2', f.read())
    f.seek(0)
    f.write(newf)

测试文件:

1000101 33434,34 1992 [3,41,4,5] 
12,43 129012 91 [1,2]
1000101 33434,34 1992 [3, 41,4,5] 

结果:

1000101 33434.34 1992 [3,41,4,5] 
12.43 129012 91 [1,2]
1000101 33434.34 1992 [3, 41,4,5] 

答案 1 :(得分:1)

试试这个:

import re
from ast import literal_eval

FLOAT_RE = re.compile('^\d+,\d+$')

lines = []
with open("input.txt", "r") as in_file:
    for line in in_file:
        line = line.strip().split(" ")
        for x in line:
            i = line.index(x)
            if FLOAT_RE.match(x):
                x = x.replace(',', '.')
            line[i] = literal_eval(x)
        lines.append(line)

print lines

答案 2 :(得分:1)

这应该适合你:

lines = []
in_file = open("input.txt", "r")
for line in in_file:
    line = line.split(" ")

    for x in line:
        tmp = eval(x)
        if isinstance(tmp, tuple):
            line[line.index(x)] = float(float(x.replace(',', '.')))
        else:
            line[line.index(x)] = tmp

    lines.append(line)
in_file.close()

它会将所有内容转换为正确的类型

答案 3 :(得分:0)

如果您的所有字符串都采用相同的格式,则只能将第一次出现的,放在一起:

s = "1000101 33434,34 1992 [3,41,4,5]"

print re.sub(",",".",s,1)
1000101 33434.34 1992 [3,41,4,5]