Python2.7 / NLTK在某些字符之前删除部分字符串

时间:2016-02-05 18:22:32

标签: python-2.7 nltk

我正在阅读一个包含371行文本的csv文件。

  

0þ“包含数字和引号的文字”þ4.6

我正在尝试提取þ“和”tex之间的短信。我怎么能这样做?

2 个答案:

答案 0 :(得分:0)

awk -F'þ"|"þ' '{print $2}' data.csv

上面的命令打印文件data.csv中每行的第二列,
其中列由þ"分隔。

答案 1 :(得分:0)

全部谢谢!

您的回复都帮我找到了解决方案:

test = sent[(sent.index('þ"')):(sent.index('"þ'))]