Powershell Cyrillic输入编码通过节点js

时间:2017-05-04 20:53:53

标签: javascript .net node.js powershell encoding

我试图制作西里尔文字转语音节点js模块。

我使用node-powershell来运行.NET TTS命令。它适用于拉丁符号,但不会对任何西里尔符号做出反应。

但是,如果我直接将命令输入到Powershell控制台 - 它适用于西里尔和拉丁符号。 enter image description here

所以我提出了一个问题,即问题点是node.js输出编码。

Node.js脚本:

var sayWin = (text) => {
  var Shell = require('node-powershell');
  var shell = new Shell({
    inputEncoding: 'binary' //tried different endcoding
  });
  shell.addCommand('Add-Type -AssemblyName System.speech');
  shell.addCommand('$speak = New-Object System.Speech.Synthesis.SpeechSynthesizer');
  shell.addCommand('$speak.Speak("' + text + '")');
  shell.on('output', data => {
    console.log("data", data);
  });
  return shell.invoke();
}

sayWin('latin'); //talk

sayWin('кирилица'); //silence

sayWin('\ufeffкирилица'); //silence trying with BOM

请注意,您可能需要安装Windows TTS语音包并选择它作为默认系统语音才能播放西里尔语文本(我以前做过)。

2 个答案:

答案 0 :(得分:0)

可能的解决方案之一是将西里尔文本音译成拉丁文模拟。它有效但远远没有达到预期的结果(单词发音不太好)。

var transliterate = function(word) {
  var a = { "Ё": "YO", "Й": "I", "Ц": "TS", "У": "U", "К": "K", "Е": "E", "Н": "N", "Г": "G", "Ш": "SH", "Щ": "SCH", "З": "Z", "Х": "H", "Ъ": "'", "ё": "yo", "й": "i", "ц": "ts", "у": "u", "к": "k", "е": "e", "н": "n", "г": "g", "ш": "sh", "щ": "sch", "з": "z", "х": "h", "ъ": "'", "Ф": "F", "Ы": "I", "В": "V", "А": "a", "П": "P", "Р": "R", "О": "O", "Л": "L", "Д": "D", "Ж": "ZH", "Э": "E", "ф": "f", "ы": "i", "в": "v", "а": "a", "п": "p", "р": "r", "о": "o", "л": "l", "д": "d", "ж": "zh", "э": "e", "Я": "Ya", "Ч": "CH", "С": "S", "М": "M", "И": "yi", "Т": "T", "Ь": "'", "Б": "B", "Ю": "YU", "я": "ya", "ч": "ch", "с": "s", "м": "m", "и": "yi", "т": "t", "ь": "'", "б": "b", "ю": "yu" };
  return word.split('').map(function(char) {
    return a[char] || char;
  }).join("");
}

var sayWin = (text) => {

  text = /[а-яА-ЯЁё]/.test(text) ? transliterate(text) : text;

  var shell = new Shell({
    inputEncoding: 'binary'
  });
  shell.addCommand('Add-Type -AssemblyName System.speech');
  shell.addCommand('$speak = New-Object System.Speech.Synthesis.SpeechSynthesizer');
  shell.addCommand('$speak.Speak("' + text + '")');
  shell.on('output', data => {
    console.log("data", data);
  });
  shell.on('err', err => {
    console.log("err", err);
  });
  shell.on('end', code => {
    console.log("code", code);
  });
  return shell.invoke().then(output => {
    shell.dispose()
  });
}

答案 1 :(得分:0)

我可能回答得太晚了,但让它留在这里以备将来使用。 我通过首先调用命令为自己解决了这个问题:

$OutputEncoding = [console]::InputEncoding = [console]::OutputEncoding = New-Object System.Text.UTF8Encoding; 

在您的情况下,它将类似于

shell.addCommand('$OutputEncoding = [console]::InputEncoding = [console]::OutputEncoding = New-Object System.Text.UTF8Encoding');