言语到文本到翻译是不可能的梦想吗?

时间:2015-06-10 21:01:19

标签: speech-recognition google-translate machine-translation

理论上,人们可以使用笔记本电脑或平板电脑或手机的麦克风来捕捉口语,将其转换为屏幕上的文字,然后通过访问谷歌翻译等API,查看“a”(不是“the” - 几乎没有无论如何,这些单词翻译的粗略“草稿”(例如,从英语到西班牙语或从西班牙语到英语)。

我认为这在法庭上很有用 - 作为法庭口译人员的一种“免提备忘录”。

理论上很简单,但是可行吗?我看到了几个潜在的问题:

必须告知软件哪种是目标语言,哪种是源语言。否则,可能会有延迟,如果将设备留给自己的设备(自动检测),有时甚至会得出错误的结论。

背景噪音和声音必须被过滤掉。

翻译(尝试)只有在发言者完成判决后才有效 - 软件如何知道?按停顿的长度?有些人长时间在句子中停顿;有些人几乎没有在句子之间停顿,所以......那会怎么样?

人们没有说清楚,或者说难以理解的口音。

这甚至没有提到(除了这里,倾斜地说)上下文经常被机器人大师翻译误解。

我的直觉是,如果亚伯拉罕林肯和马丁路德金同时发言(即使在法庭上,有时也会发生),软件会提出这样的事情:

对于得分和七年前我很高兴和你一起参加比赛。我们的父亲在这个大陆上取得了第四名,这是一个新的国家,在历史上将成为自由中最伟大的人,而且。致力于为所有人的自由示范创造平等的汗水。我们国家的历史。

......然后翻译成这样的东西:

Porpuntuaciónyhacesieteñosqueestoy encantado de unirme a ustedes hoy。 Nuestros padres trajeron cuarto en este continente,unanuevanación,en lo que va a pasar a la historia como el mayor concebida en la libertad,y。 Dedicada alatransiraciónquelademostraciónporla libertad en todos los hombres son creados iguales。 La historia denuestranación。

我想,我说的是人类在谈到这类事情时“摇滚” - 至少与机器(软件)相比,目前的复杂程度,但我们是否,或者我们是否会, “摇滚”足以克服这个问题?有没有办法克服这些障碍,至少在足够的程度上使这样的程序值得使用?完美无法实现;我认为,匹配人类技能也是一个无法实现的目标,特别是因为背景因素。尽管如此:可以语音到文本到语境到翻译甚至可以做得更好,如果是这样,怎么做?

1 个答案:

答案 0 :(得分:1)

我相信这是可能的,而且可以做得相对好:

  • 设备应该能够根据各种传感器和内存提供的数据部分理解上下文, 这些需要经过精心调整以获得良好的结果,但这不是人们实际上一直在做的事情吗?我们根据我们的看法,感受,我们所处的位置来评估背景;我们所看到的,我们的感受以及我们曾经去过的地方 - 智能设备应该能够重现那个

  • 设备应该能够根据它所知道的关于给定语言的一切来猜测句子结束/开始的位置 - 人们也这样做,

如果设备具有与人类相同的传感器,知识和记忆,那么它理论上可以做同样的事情。

即使一眨眼也可以提供很多背景信息,我认为这一切都归结为设备接受并用于正确翻译文本的复杂性和数据范围。知道得越多越好。