是否可以确定电子邮件(MIME 1.0)的区域设置(语言)?我正在处理的特定用例是尝试区分每个电子邮件的某些区域设置,然后根据自定义smtp服务器进行相应的转换。
答案 0 :(得分:1)
查看Content-Type标头的charset值。除非它是UTF-8,否则通常可以了解电子邮件的组成语言。
这有帮助吗?
答案 1 :(得分:0)
没有可靠的方法,但在某些情况下,像libtextcat
这样的语言猜测器的精确度就足够了。
如果沿着这条路走下去,请注意libtextcat
附带了非常粗略的语言模型集合,这些模型基本上只是一个概念验证。 LibreOffice维护一个fork libexttextcat
,它具有适当的语言模型,但仅适用于Unicode。创建自己的语言模型也不是很难。