我在.py文件中有以下代码:
import re
regex = re.compile(
r"""ULLAT:\ (?P<ullat>-?[\d.]+).*?
ULLON:\ (?P<ullon>-?[\d.]+).*?
LRLAT:\ (?P<lrlat>-?[\d.]+)""", re.DOTALL|re.VERBOSE)
我将.txt文件中的数据作为序列:
QUADNAME: rockport_colony_SD
RESOLUTION: 10 ULLAT: 43.625 ULLON:
-97.87527466 LRLAT: 43.5 LRLON: -97.75027466 HDATUM: 27 ZMIN: 361.58401489 ZMAX: 413.38400269 ZMEAN: 396.1293335 ZSIGMA: 12.36359215 PMETHOD: 5 QUADDATE: 20001001
如何使用Python -file处理.txt文件?
我想我们需要.py文件中的参数,以便我们可以使用类似终端的语法:
$ py-file file-to-be-processed
帖子here提出了这个问题。
答案 0 :(得分:18)
您需要读取文件,然后使用正则表达式搜索内容。 sys模块包含一个列表argv,其中包含所有命令行参数。我们拉出第二个(第一个是用于运行脚本的文件名),打开文件,然后读入内容。
import re import sys file_name = sys.argv[1] fp = open(file_name) contents = fp.read() regex = re.compile( r"""ULLAT:\ (?P-?[\d.]+).*? ULLON:\ (?P-?[\d.]+).*? LRLAT:\ (?P-?[\d.]+)""", re.DOTALL|re.VERBOSE) match = regex.search(contents)
有关您可以对匹配对象执行的操作的详细信息,请参阅Python regular expression documentation。有关我们在扫描文件时需要搜索而不是匹配的原因,请参阅this part of the documentation。
此代码允许您使用您在问题中指定的语法。