我正在使用Atom来格式化一些文本数据以进行分析(我知道可能有比这更好的方法,所以我很高兴),但是它似乎并不能识别我的正则表达式。>
文本是带有POS标签的令牌,其句子用换行符表示,格式如下:
good\tJJ\n
workout\tNN\n
.\t.\n
''\t''\n
\n
Perhaps\tRB\n
the\tDT\n
我可以用斜杠(\t
)替换所有制表符(/
)没问题,但是我现在尝试将所有不要划定句子的换行符只是一个空间。我尝试了\S\n
,但“找不到”。我还尝试用^\n$
突出显示所有划定的换行符,但只有两个匹配项,并且仅在文档末尾。
我做错了吗?我对regex的唯一用法是与Python一起使用,因此在Atom中也许有一种不同的实现方式。