文本文件中的唯一字词

时间:2017-01-23 19:43:33

标签: text-files unique

我想知道是否有办法在文本文件中查找(并显示)所有唯一单词(出现一次的单词)?这可以只使用命令行吗?或者我是否必须使用类似python脚本的东西?

1 个答案:

答案 0 :(得分:0)

如果您不想编写应用程序,那么我能想到的最简单的方法就是使用PowerShell。见:

https://msdn.microsoft.com/en-us/powershell/reference/5.1/microsoft.powershell.utility/get-unique

Microsoft提供的示例使用唯一单词列表填充变量:

$A = $(foreach ($line in Get-Content C:\Test1\File1.txt) {$line.tolower().split(" ")}) | sort | Get-Unique

您可能希望使用其他分隔符来分割标点符号,例如:

$A = $(foreach ($line in Get-Content C:\test.txt) {$line.tolower().split(" .,?!;:")}) | sort | Get-Unique

将其放在扩展名为.ps1的文件中,您可以从命令行运行它。为了从变量中获取值只是第二行,变量将结果回显到屏幕:

$A

要获取数组中的项目数,您可以这样做:

$A.count