所以我有以下字符串(每个字符串是.txt文件的一行),并且我建立了一个解析器来按如下方式解析第一行:
line1: " N1 0.00000000 0.00000000 0.00000000 Type N Rank 4"
parser1 = Word(alphas + nums) + Word(printables + '.' + printables) + Word(printables + '.' + printables) \
+ Word(printables + '.' + printables) + Word(alphas) + Word(alphas) + Word(alphas) + Word(nums)
result = (['N1', '0.00000000', '0.00000000', '0.00000000', 'Type', 'N', 'Rank', '4'], {})
哪个很棒。但是,在此行之后仅是浮点数,该浮点数可能带有或没有负号,例如:
line2 = " -1.064533
-0.000007 -0.130782 0.044770
0.335373 -0.000007 -0.000006 -0.451296 0.378061
-0.000034 -0.990753 -1.404081 -0.000067 -0.000150
-0.096208 -0.714299
-0.017676 0.000019 0.000034 0.804011 0.911492
0.000019 0.000027 0.441683 0.107567"
我尝试使用以下解析器来获取这些数字,但不幸的是,它也会同时获取line1:
parser2 = Word(printables + '.' + printables)
是否有一种解析浮点数的方法,可能以更好的方式包括可打印的减号?
非常感谢(我是pyparsing的新手,所以请随心所欲地苛刻)
答案 0 :(得分:0)
<form class="needs-validation" id="register-form" novalidate>
<a href="javascript:history.back()" class="breadcrumbs small"><span class="back">‹</span> Volver atrás</a>
<h1>Regístrate</h1>
<div>
<input type="email" class="form-control" id="Email" placeholder="Correo eléctronico" required>
<div class="invalid-feedback correo-inavlid">Por favor, introduce un correo electrónico</div>
<div class="corporativo-invalid">Por favor, introduce un correo corporativo</div>
</div>
<div>
<input type="password" class="form-control" id="loginPassword" placeholder="Contraseña" required>
<div class="invalid-feedback">Por favor, introduce una contraseña</div>
</div>
<div class="d-sm-flex text-center justify-content-between align-items-center">
<button class="btn login-form-button" type="submit" id="register-button">QUIERO REGISTRARME <span>›</span></button>
<p class="small">¿Ya estás registrado? <a href="login.html">Inicia sesión <span>›</span></a></p>
</div>
</form>
并没有按照您的想法进行。 Word(printables + '.' + printables)
是一个字符串,因此printables
的计算结果是一个 really 长字符串,其中包含所有可打印字符,后跟一个句点,然后又是所有可打印字符。然后,该字符串用于构造printables + '.' + printables
对象,该对象将匹配所有可打印字符集中的以空格分隔的字符组(并且由于'。'是可打印的,因此它位于已经设置)。
我怀疑,您真正想用可选的前导减号来解析实数的东西是
Word
请注意,添加操作是使用解析表达式完成的,而不是传递给Word的字符串。这会将'-1.23'解析为Optional('-') + Word(nums) + '.' + Word(nums)`
。要将所有内容作为单个字符串,请将其包装在Combine中:
['-', '1', '.', '23']
然后,使用该表达式将得到'-1.23'。之后仍然需要您使用内置的Combine(Optional('-') + Word(nums) + '.' + Word(nums))
将其转换为Python浮点数。
float()
是一个预定义的浮点解析表达式,将处理前导符号,和在解析时从字符串转换为浮点,以便从解析器获取值时,它已经转换为浮点数。