将文本的底部与顶部的文本进行匹配,并满足其他一些格式要求。
下面是一段文本的摘录,在大文件中重复出现。
B. Silva
MID MAN CITY
A. Robertson
DEF LIVERPOOL
A. Lacazette
ST ARSENAL
C. Azpilicueta
DEF CHELSEA
. Alisson
GK LIVERPOOL
L. Sane
MID MAN CITY
P. Pogba
MID MAN UTD
K. Walker
DEF MAN CITY
M. Alonso
DEF CHELSEA
R. Jimenez
ST WOLVES
G. Jesus
ST MAN CITY
H. Son
ST SPURS
M. Doherty
DEF WOLVES
R. Firmino
ST LIVERPOOL
Ederson
GK MAN CITY
D. Silva
MID MAN CITY PRICE GW PTS AVG PTS TOTAL
PTS SELECTED %
£4.7m - 4.5 223 19%
£4.6m 8 4.6 221 38.8%
£5.3m - 4.5 219 15.1%
£4.3m - 3.8 210 14.2%
£4.2m 13 4.1 209 25.8%
£5.7m - 4.4 204 18.6%
£5.1m - 4.2 199 22.5%
£4.7m - 3.8 196 19.8%
£4.8m - 5.1 193 17.8%
£4.8m - 4.4 193 4.8%
£4.9m - 4.2 192 9.8%
£5.2m 0 3.9 189 10%
£4.5m - 4.2 189 10.6%
£4.8m 0 3.8 183 16.3%
£4.2m - 3.2 178 26.8%
£3.8m - 3.5 176 9.4%
我希望通过以下方式对其进行格式化:
B. Silva, MID, MAN CITY, £4.7m - 4.5 223 19%
A. Robertson, DEF, LIVERPOOL, £4.6m 8 4.6 221 38.8%
答案 0 :(得分:0)
这是我最后的做法:
我不需要的文字(MID MAN CITY PRICE GW PTS AVG PTS TOTAL&PTS SELECTED%)我首先出现了
$ cat stats.txt | grep -v "PTS" > file.txt
Grep仅使用英镑作为标识点
$ cat file.txt | grep £ > points.txt
$ cat file.txt | grep -v £ > playersandteams.txt
然后,我在Notepat ++中使用了一个宏来使玩家和团队处于同一行。然后使用带有空间分隔符的切口将它们分开。我知道还有很长的路要走...
然后我将它们全部复制到电子表格中,因为这是我认为最好地表示数据的方式。我确定有办法做到这一点,但是我认为需要一个bash / python脚本来创建行指针。