我如何通过文本文件编写urpos脚本?

时间:2011-02-23 02:15:05

标签: linux bash nlp nltk

我的目的是使用POS解析器HunPos http://code.google.com/p/hunpos/wiki/UserManualI

解析几个文本文件

有没有办法通过一堆文本文件来压缩脚本数据?

1 个答案:

答案 0 :(得分:1)

典型机制如下:

for f in glob; do command $f ; done

我经常运行像for f in *; do echo -n "$f " ; cat $f ; done这样的命令来查看目录中所有文件的内容。 (特别适合/proc/sys/kernel/ - 样式目录,其中所有文件的内容都很短。)

find . -type f -exec command {} \;

find . -type f -print0 | xargs -0 command parameters

find . -type f -exec file {} \;find . -type f -print0 | xargs -0 file之类的东西(仅在输入期间命令接受多个文件名时才有效。)

当然,如果程序接受多个文件名参数(如catmore或类似的Unix shell工具)并且所有文件都在一个目录中,则可以非常轻松地运行:{{ 1}}(显示目录中所有文件的内容)或cat *(显示文件名中包含句点的所有文件的内容)。

如果您经常需要“所有[子] *目录中的所有文件”,则zsh **/选项可以很方便:cat *.*会显示ls -l **/*.cfoo/bar/baz.c立刻。整洁的工具,但我通常不介意编写等效的/blort/bleet/boop.c命令,我只是不经常需要它。 (zsh并没有随处安装,所以依赖它的功能将来可能会令人沮丧。)