简而言之:如何将10000个单词的TXT文件拆分为100个单词的TXT文件。 我正在尝试按字数分割大型文本文件。 到目前为止,我能找到的最好的选择是该软件(Gsplit),但它只有按行拆分的选项。 enter image description here
此应用程序具有按模式拆分的选项。 按行拆分的Exp为:“ 0x0D0x0A”。 那么,是否有任何模式可以通过字数分割文本文件(通过此Gsplit应用程序或其他方式)?
答案 0 :(得分:0)
由于您已经用问题标记了“ java”,因此下面是一个简单的Java代码,用于通过空格分隔来计算单词数。
public class Splitting {
public static void main(String[] args) {
String inputLines = "This class is for split words by spaces and count the number of words";
String[] words = inputLines.split(" ");
System.out.println(Arrays.toString(words));
System.out.println("No of words: "+words.length); }
}
输出:
[This, class, is, for, split, words, by, spaces, and, count, the, number, of, words]
No of words: 14
希望这会有所帮助!