我有以下表格的数据:
<A> <pred> "7630000.0"^^<m^2> .
<R> <pred> "2150000.0e11"^^xsd:integer .
<G> <pred> "5.85E7"^^</km^2> .
<T> <pred> "4810000.0"^^<http://www.w3.org/2001/XMLSchema#nonNegativeInteger> .
<Y> "this 18" "1.863E8"^^<s> .
<D> <pred> "2023428.2112e09"^^<> .
<GS> <wd> "760mm"^^<en> .
<Vi> <hasIn> "13.89"^^<%> .
现在我想提取最后一个引号中的所有数值并将它们存储到一个文件中。注意,这里我想留下所有非数值,例如&#34;760毫米&#34 ;.例如,对于上面的示例,我想提取以下数值:
7630000.0, 2150000.0e11, 5.85E7, 4810000.0, 1.863E8, 2023428.2112e09, 13.89,
我尝试通过拆分&#34;来做同样的事情。但通过这样做,我最终得到18也是我不想要的。在python中是否有某种方法或使用linux命令,我可以通过它实现相同的目标。
答案 0 :(得分:1)
您希望格式会改变吗?您是否期望除数字,小数点和&#39; e&#39; E&#39; E&#39;以外的任何有效字符? 我做了你做的事情,将这些项目存储在一个列表中,并排除任何不是数字的东西。
for char in possible_number:
if char not in '0123456789.eE':
# exclude item...