在AWS Lambda函数中使用非英文字符将Json主体截断

时间:2018-10-13 16:18:32

标签: python json aws-lambda urllib2

我正在使用API​​网关,并且AWS Lamdba函数用作我公司的API(C#Web API 2.0)的代理 Lambda函数用Python 2.7编写,我正在使用Pyhton的urllib2将http请求传递给API。

当我发送包含希伯来字符的json正文时,遇到一个奇怪的问题。 杰森在中间被裁掉了。我确保从Lambda发送的Json已完成,但是在Lambda中接收到的json主体在途中被打乱了。

这是Lambda函数:

from __future__ import print_function

import json
import urllib2
import HTMLParser


base = "http://xxxxxx/api"

hparser = HTMLParser.HTMLParser()

def lambda_handler(event, context):
    print("Got event\n" + json.dumps(event, indent=2))

    # Form URL
    url = base + event['queryStringParameters']['rmt']
    print('URL = %s' % url)
    req = urllib2.Request(url)
    if 'body' in event:
        if event['body']:
            print('BODY = %s' %  json.dumps(event['body'], ensure_ascii=False, encoding='utf8') )
            req.add_data(json.dumps(event['body'], ensure_ascii=False, encoding='utf8'))


    # Copy only some headers
    if 'headers' in event:
        if event['headers']:
            copy_headers = ('Accept', 'Content-Type', 'content-type')
            for h in copy_headers:
                if h in event['headers']:
                    print('header added = %s' % event['headers'][h])
                    req.add_header(h, event['headers'][h])


    # Build response
    out = {}
    headersjsonstr = ('Access-Control-Allow-Origin', '')
    response_header = {}

    try:
        print('Trying here...')
        resp = urllib2.urlopen(req)
        out['statusCode'] = resp.getcode()
        out['body'] = resp.read()
        for head in resp.info().headers:

            keyval = head.split(':')
            if any(keyval[0] in h  for h in headersjsonstr): 
                response_header[keyval[0]] = keyval[1].replace('\r','').replace('\n','').strip()

        print('response_header = %s' % response_header )
        out['headers'] = response_header
        print('status = %s' % out['statusCode'] )

    except urllib2.HTTPError as e:

        out['statusCode'] = e.getcode()
        out['body'] = e.read()
        out['headers'] = e.headers
        print('status = %s' % out['statusCode'] )

    return out

这是Post请求原始正文Json

{"company":"שלום","guests":[{"fullname":"אבי","carno":"67"}],"fromdate":"2018-10-10","todate":"2018-10-10","fromtime":"07:31","totime":"07:31","comments":null,"Employee":{"UserId":"ink1445"}}

这就是我在API上得到的:

"{\"company\":\"שלום\",\"guests\":[{\"fullname\":\"אבי\",\"carno\":\"67\"}],\"fromdate\":\"2018-10-10\",\"todate\":\"2018-10-10\",\"fromtime\":\"07:31\",\"totime\":\"07:31\",\"comments\":null,\"Employee\":{\"UserId\":\"ink1

同样,当我只发送英文字母时,一切都很好。

请帮助!

谢谢

1 个答案:

答案 0 :(得分:0)

很有可能您的json缓冲区太小,并且您会被溢出截断。

大小可能是在假设ASCII或utf-8编码的情况下设置的,并且您的Unicode字符更宽(占用更多字节)。

根据您使用的是什么json包,您可以为unicode设置一个选项,或者可能需要手动调整缓冲区大小。