Windows将文件夹从RTF转换为UTF-8

时间:2018-02-09 21:27:16

标签: unicode encoding utf-8

我正在尝试使用Python中的konlpy模块分析620篇韩语报纸文章的语料库。文件采用rtf格式。但是,konlpy仅支持以UTF-8编码的文件。在Windows中,如何将包含620 rtf编码文章的文件夹转换为UTF-8文章,这样在打开记事本中的文件时,韩文字符仍然很明显?

我尝试过的一些事情(但无济于事)

使用免费软件转换器程序(http://www.emreakkas.com/localization-tools/convert-rtf-to-txt)将文件转换为UNICODE,然后尝试使用Cygwin iconv批处理文件使用与此个人相同的脚本转换文件:

cygwin syntax error near unexpected token `done'

当我这样做时,所有文件都在那里但它们是0KB并且它们是空白的。 (如果您需要有关此方法的更多信息,请告诉我,因为我需要执行另一步以使其均匀循环我的文件)

使用另一个免费软件程序(内存有点朦胧)转换了rtf文件,但所有字符都只是乱码拉丁字符。

我认为必须有一个简单的方法来做到这一点,但我尝试的一切都非常复杂,无法正常工作。另一个有趣的事情是,每当我只需手动将原始rtf文件或文件转换为UNICODE和"另存为"并选择UTF-8,它工作正常。如果我不需要"另存为"我会喜欢它。共620篇文章。

谢谢!

0 个答案:

没有答案