我已经在新的Debian服务器上安装了Eggdrop,其中包含TCL8.5和最新版本的eggdrop。不幸的是我的脚本和特殊字符的处理有问题,如é,J'aime等。
最好向您展示一个示例:
13:41 <@me> test
13:41 <@me> !tr nl This is a test
13:41 < bot> Dit is een test
13:41 <@me> !tr fr I am a stranger
13:41 < bot> Je suis un étranger
13:41 <@me> !tr fr I love you
13:42 < bot> Je t'aime
我添加了说转换为utf-8的行,eggdrop也在utf-8运行,它似乎使我的irc客户端可以读取étranger,但是大多数字符(中文,阿拉伯语)并不接近所有。 TCL代码如下:
namespace eval gTranslator {
bind pub - !tr gTranslator::translate
proc translate { nick uhost handle chan text } {
package require http
package require json
set lngto [string tolower [lindex [split $text] 0]]
set text [::http::formatQuery q [join [lrange [split $text] 1 end]]]
set dturl "http://ajax.googleapis.com/ajax/services/language/detect?v=1.0&q=$text"
set res [::json::json2dict [::http::data [::http::geturl $dturl]]]
set lng [dict get $res responseData language]
if { $lng == $lngto } {
putserv "PRIVMSG $chan :\002Error\002 translating $lng to $lngto."
return 0
}
set trurl "http://ajax.googleapis.com/ajax/services/language/translate?v=1.0&langpair=$lng%7c$lngto&$text"
putlog $trurl
set res [::json::json2dict [::http::data [::http::geturl $trurl]]]
putlog $res
#putserv "PRIVMSG $chan :Language detected: $lng"
set translated [dict get $res responseData translatedText]
putserv "PRIVMSG $chan :[encoding convertto utf-8 $translated]"
}
}
通过telnet连接提供了以下附加信息:
*** Me joined the party line.
[13:49:34] http://ajax.googleapis.com/ajax/services/language/translate?v=1.0&langpair=en%7cfr&q=I%20like%20cookies
[13:49:34] responseData {translatedText {J'aime les cookies}} responseDetails null responseStatus 200
[13:50:11] http://ajax.googleapis.com/ajax/services/language/translate?v=1.0&langpair=en%7cfr&q=I%20am%20a%20stranger
[13:50:11] responseData {translatedText {Je suis un étranger}} responseDetails null responseStatus 200
答案 0 :(得分:2)
这里有很多问题。一个是Google正在提供字符串,其中实体编码应用独立于JSON编码。你必须解码它。其次,你有内存泄漏(由http::geturl
返回的令牌需要手动清理),最好通过编写帮助程序来解决这个问题:
namespace eval gTranslator {
# Factor this out into a helper
proc getJson url {
set tok [http::geturl $url]
set res [json::json2dict [http::data $tok]]
http::cleanup $tok
return $res
}
# How to decode _decimal_ entities; WARNING: high magic factor within!
proc decodeEntities str {
set str [string map {\[ {\[} \] {\]} \$ {\$} \\ \\\\} $str]
subst [regsub -all {&#(\d+);} $str {[format %c \1]}]
}
bind pub - !tr gTranslator::translate
proc translate { nick uhost handle chan text } {
package require http
package require json
set lngto [string tolower [lindex [split $text] 0]]
set text [http::formatQuery q [join [lrange [split $text] 1 end]]]
set dturl "http://ajax.googleapis.com/ajax/services/language/detect?v=1.0&q=$text"
set lng [dict get [getJson $dturl] responseData language]
if { $lng == $lngto } {
putserv "PRIVMSG $chan :\002Error\002 translating $lng to $lngto."
return 0
}
set trurl "http://ajax.googleapis.com/ajax/services/language/translate?v=1.0&langpair=$lng%7c$lngto&$text"
putlog $trurl
set res [getJson $trurl]
putlog $res
#putserv "PRIVMSG $chan :Language detected: $lng"
set translated [decodeEntities [dict get $res responseData translatedText]]
putserv "PRIVMSG $chan :[encoding convertto utf-8 $translated]"
}
}
(你已经应用了encoding convertto utf-8
来解决eggdrop对编码缺乏正确认识的问题。)
我检查了查询阿拉伯语回复的结果,看起来UTF-8返回正确。因此,您遇到的任何问题都在您的客户端。 (由于Tcl目前只处理Unicode的基本多语言平面 - BMP,因此某些中文字符可能存在问题。这是一个已知问题。)