我需要处理大量的简历。并希望使用此解析器: https://github.com/antonydeepak/ResumeParser 但是你在powershell中运行它,包含要读取的文件和输出文件。 但我不知道如何自动执行此操作,因此它会读取包含简历的整个文件夹。
我知道一些Java,但无法打开代码。 PowerShell中的脚本编写方式是什么?
谢谢!
答案 0 :(得分:0)
> java -cp '.\bin\*;..\GATEFiles\lib\*;..\GATEFILES\bin\gate.jar;.\lib\*'
code4goal.antony.resumeparser.ResumeParserProgram <input_file> [output_file]
从已编辑的目录列表中创建批处理文件,或编写程序。 因为这是stackoverflow:
因此,从相同的类路径(-cp ...)开始,您可以运行自己的程序
public void static main(String[] args) throws IOException {
File[] files = new File("C:/resumes").listFiles();
File outputDir = new File("C:/results");
outputDir.mkDirs();
if (files != null) {
for (File file : files) {
String path = file.getPath();
if (path.endsWith(".pdf")) {
String output = new File(outputDir,
file.getName().replaceFirst("\\.\\w+$", "") + ".json").getPath();
String[] params = {path, output);
ResumeParserProgram.main(params);
// For creating a batch file >x.bat
System.out.println("java -cp"
+ " '.\\bin\\*;..\\GATEFiles\lib\\*;"
+ "..\\GATEFILES\\bin\\gate.jar;.\\lib\\*'"
+ " code4goal.antony.resumeparser.ResumeParserProgram"
+ " \"" + path + "\" \"" + output + "\"");
}
}
}
}
检查这是否有效,ResumeParserProgram.main是可重新输入的。