如何解析pyparsing中的浮点数,包括减号

时间:2019-01-23 10:30:50

标签: python floating-point pyparsing

所以我有以下字符串(每个字符串是.txt文件的一行),并且我建立了一个解析器来按如下方式解析第一行:

line1: " N1 0.00000000 0.00000000 0.00000000 Type N Rank 4"

parser1 = Word(alphas + nums) + Word(printables + '.' + printables) + Word(printables + '.' + printables) \
                  + Word(printables + '.' + printables) + Word(alphas) + Word(alphas) + Word(alphas) + Word(nums)

result = (['N1', '0.00000000', '0.00000000', '0.00000000', 'Type', 'N', 'Rank', '4'], {})

哪个很棒。但是,在此行之后仅是浮点数,该浮点数可能带有或没有负号,例如:

line2 = " -1.064533
      -0.000007      -0.130782       0.044770
       0.335373      -0.000007      -0.000006      -0.451296       0.378061
      -0.000034      -0.990753      -1.404081      -0.000067      -0.000150
                     -0.096208      -0.714299
      -0.017676       0.000019       0.000034       0.804011       0.911492
                      0.000019       0.000027       0.441683       0.107567"

我尝试使用以下解析器来获取这些数字,但不幸的是,它也会同时获取line1:

parser2 = Word(printables + '.' + printables)

是否有一种解析浮点数的方法,可能以更好的方式包括可打印的减号?

非常感谢(我是pyparsing的新手,所以请随心所欲地苛刻)

1 个答案:

答案 0 :(得分:0)

<form class="needs-validation" id="register-form" novalidate> <a href="javascript:history.back()" class="breadcrumbs small"><span class="back">‹</span> Volver atrás</a> <h1>Regístrate</h1> <div> <input type="email" class="form-control" id="Email" placeholder="Correo eléctronico" required> <div class="invalid-feedback correo-inavlid">Por favor, introduce un correo electrónico</div> <div class="corporativo-invalid">Por favor, introduce un correo corporativo</div> </div> <div> <input type="password" class="form-control" id="loginPassword" placeholder="Contraseña" required> <div class="invalid-feedback">Por favor, introduce una contraseña</div> </div> <div class="d-sm-flex text-center justify-content-between align-items-center"> <button class="btn login-form-button" type="submit" id="register-button">QUIERO REGISTRARME <span>›</span></button> <p class="small">¿Ya estás registrado? <a href="login.html">Inicia sesión <span>›</span></a></p> </div> </form> 并没有按照您的想法进行。 Word(printables + '.' + printables)是一个字符串,因此printables的计算结果是一个 really 长字符串,其中包含所有可打印字符,后跟一个句点,然后又是所有可打印字符。然后,该字符串用于构造printables + '.' + printables对象,该对象将匹配所有可打印字符集中的以空格分隔的字符组(并且由于'。'是可打印的,因此它位于已经设置)。

怀疑,您真正想用可选的前导减号来解析实数的东西是

Word

请注意,添加操作是使用解析表达式完成的,而不是传递给Word的字符串。这会将'-1.23'解析为Optional('-') + Word(nums) + '.' + Word(nums)` 。要将所有内容作为单个字符串,请将其包装在Combine中:

['-', '1', '.', '23']

然后,使用该表达式将得到'-1.23'。之后仍然需要您使用内置的Combine(Optional('-') + Word(nums) + '.' + Word(nums)) 将其转换为Python浮点数。

float()是一个预定义的浮点解析表达式,将处理前导符号,在解析时从字符串转换为浮点,以便从解析器获取值时,它已经转换为浮点数。