修复了Google语音文本API响应中的错误字符集

时间:2019-06-03 21:15:32

标签: ubuntu-18.04 google-speech-api

我正在用罗马尼亚语设置准系统语音转文本应用程序,返回文件无法识别特殊字符。

运行命令后

$ gcloud ml speech recognize ./foo.wav --language-code='ro-RO' > foo.txt

在文本编辑器中打开文件显示

“ folose \ u0219ti cuvintele故事s \ u0103 vorbim cu virgul \ u0103 \ u0219i cu puncte”

预期输出为:

“ folosești cuvintelesăvorbim cuvirgulăși cu puncte的故事”

我已尝试使用iconv进行多次转换,但都没有成功,大致如下:

$ iconv -f us-ascii -t utf-8 foo.txt > foo2.txt
$ iconv -f ascii -t utf-8 foo.txt > foo2.txt

我能想到的(似乎很少)似乎毫无用处。有没有办法让编辑器显示这些字符而无需构建整个脚本来分析文本并将它们放置在需要的地方?

0 个答案:

没有答案