如何在文本文件的每一行上的单词后删除所有内容?

时间:2012-12-17 10:14:03

标签: replace editor

我有一个看起来有点像这样的文本文件

356, http://linkgoeshere.com/4445555 title="The Chariot"> <br />
356, http://linkgoeshere.com/4445555 title="fddsfssfd"> <br />
356, http://linkgoeshere.com/4445555 title="T3434534535"> <br />

我想把所有东西都放到链接上并删除所有内容但是后面的每个部分除了标题之外是唯一的=所以我找不到并替换。

(这个btw约800行)

有什么办法可以用编程来做到这一点吗?

感谢。

3 个答案:

答案 0 :(得分:1)

Notepad++中,您可以使用正则表达式

进行查找和替换
  • 点击菜单Search --> Replace...
  • Search Mode中选择Regular expression
  • \stitle=".*$
  • 中输入正则表达式Find what
  • Replace with框设为空
  • 点击Replace all

在版本6.2.2

中测试

这也适用于支持使用正则表达式查找和替换的其他编辑器。

答案 1 :(得分:0)

  • 编辑方式(vim):

用vim打开你的文件,输入你会看到结果的:%s/ title=.$//g

实际上任何编辑器支持正则表达式替换都可以。

  • 脚本编程:

<强> SED

(注意:以下命令将进行更改。)

sed -i 's/ title=.$//' file 

<强> AWK

棘手的方式,没有正则表达式:

awk '{print $1,$2}' file  

你在stdout上看到了输出。您可以通过awk... >newFile

将其重定向到文件

答案 2 :(得分:0)

<强> Excel中
如果您的编辑器不支持正则表达式,请使用Excel将文件导入为csv文件(Data - &gt; From Text)并告诉excel将该空格用作字段分隔符。然后将前两列导出为新的csv文件。