我正在使用包含图书引文信息的文件。例如标题,作者,出版商,以这种格式的字体大小:
Austen (Hy. T.)—lectures on passages in
Genesis. 8vo., 6s HATCHARD, Feb. 20
Austen (Jane)—Emma. (Standard Novels.
No. 25.) i2mo., 6s BENTLEY, 32
如果我逐行搜索并使用正则表达式提取出作者和发布者等,有没有办法保存或匹配未搜索的字符串部分?
澄清:
我特别指的是,如果我有一些标签,例如一个用于发布者的作者和一个用于标题的标签,并且在这些标签之间有额外的信息,我怎样才能获得所有这些"未使用的"部分?