我正在使用GCP翻译API来检查使用语言检测端点的内容的语言代码。
声明:我用于翻译的内容可能有两种语言的本地化,我希望检测这两种语言。
问题:如果我在一个段落中混合来自另一种语言的内容,则置信度值返回形式端点也会返回100%。
有没有办法检测内容是否只有一种语言或多于一种?
示例内容:
英语:
Lorem Ipsum只是打印和排版的虚拟文本 行业。 Lorem Ipsum一直是业界标准的虚拟文本 自16世纪以来,当一个未知的打印机采用了类型的厨房 把它拼凑成一本样本书。它不仅幸存下来 五个世纪,也是电子排版的飞跃, 基本保持不变。
法
Lorem Ipsum est simplement un faux texte de l'industrie de l'impression et de la composition。 Lorem Ipsumaétéletexte factice 标准的工业部门工程部门1500,quand une imprimante 不列颠哥伦比亚省是一个不可忽视的地方 livredespécimendetype。 Ilarevenécuinseulementcinqsiècles, mais aussi le saut dans lacompositionélectronique,demeurant essentiellementinhangé。
如果我尝试检测语言,它会显示100%由于GCP定位算法的信心。
提前致谢。