我正在尝试使用utf-8文本从python中使用google translate。 我如何调用json api?他们有一个用于在html中嵌入它的文档,但我无法在任何地方找到合适的API或wsdl。
由于 圣拉斐尔
答案 0 :(得分:7)
这是最终适合我的代码。 使用没有ajax api的网站可以禁止你的IP,所以这样更好。
#!/usr/bin/env python
from urllib2 import urlopen
from urllib import urlencode
import urllib2
import urllib
import simplejson
import sys
# The google translate API can be found here:
# http://code.google.com/apis/ajaxlanguage/documentation/#Examples
def translate(text = 'hola querida'):
tl="es"
sl="en"
langpair='%s|%s'%(tl,sl)
base_url='http://ajax.googleapis.com/ajax/services/language/translate?'
data = urllib.urlencode({'v':1.0,'ie': 'UTF8', 'q': text.encode('utf-8'),
'langpair':langpair})
url = base_url+data
search_results = urllib.urlopen(url)
json = simplejson.loads(search_results.read())
result = json['responseData']['translatedText']
return result
答案 1 :(得分:2)
使用Peteris Kramins的xgoogle(His blog)
>>> from xgoogle.translate import Translator
>>>
>>> translate = Translator().translate
>>>
>>> print translate("Mani sauc Pēteris", lang_to="en")
My name is Peter
>>>
>>> print translate("Mani sauc Pēteris", lang_to="ru").encode('utf-8')
Меня зовут Петр
>>>
>>> print translate("Меня зовут Петр")
My name is Peter
答案 2 :(得分:1)
看看我找到了什么:http://code.google.com/intl/ru/apis/ajaxlanguage/terms.html
这是有趣的部分:
您不会,也不会允许您的最终用户或其他第三方: .... *提交超过5000个字符的任何请求; ....
答案 3 :(得分:0)
我认为你在谈论ajax api http://code.google.com/apis/ajaxlanguage/, 必须从javascript使用,所以我不明白你的意思是“谷歌翻译从python”
或者,如果你需要使用python的翻译功能,你可以直接查询翻译页面并使用xml / html lib解析它,例如美丽的汤,html5lib
实际上我曾经这样做了一次美丽的汤在谷歌翻译上没有用,但是html5lib(http://code.google.com/p/html5lib/)做了
你需要做这样的事情(从我更大的代码库中复制)
def translate(text, tlan, slan="en"):
opener = urllib2.build_opener()
opener.addheaders = [('User-agent', 'translate.py/0.1')]
htmlPage = opener.open(
"http://translate.google.com/translate_t?" +
urllib.urlencode({'sl': slan, 'tl':tlan}),
data=urllib.urlencode({'hl': 'en',
'ie': 'UTF8',
'text': text.encode('utf-8'),
'sl': slan, 'tl': tlan})
)
parser = html5lib.HTMLParser(tree=treebuilders.getTreeBuilder("etree", cElementTree))
etree_document = parser.parse(htmlPage)
return _getResult(etree_document)