如何使用lambda函数从AWS s3获取文本文件的内容?

时间:2015-06-04 18:32:27

标签: javascript amazon-web-services amazon-s3 aws-lambda

我想知道是否可以为AWS设置lambda函数,只要将新文本文件上传到s3存储桶中就会触发。在函数中,我想获取文本文件的内容并以某种方式处理它。我想知道这是否可能......?

例如,如果我上传foo.txt,内容为foobarbaz,我想以某种方式在我的lambda函数中获取foobarbaz,所以我可以用它来做事。我知道我可以从getObject或类似的方法获取元数据。

谢谢!

3 个答案:

答案 0 :(得分:47)

S3对象键和存储桶名称通过事件参数传递到Lambda函数。然后,您可以从S3获取对象并读取其内容。

从Lambda event检索存储桶和对象密钥的基本代码如下:

exports.handler = function(event, context, callback) {
   var src_bkt = event.Records[0].s3.bucket.name;
   var src_key = event.Records[0].s3.object.key;
};

获得存储桶和密钥后,可以调用getObject来检索对象:

var AWS = require('aws-sdk');
var s3 = new AWS.S3();

exports.handler = function(event, context, callback) {

    // Retrieve the bucket & key for the uploaded S3 object that
    // caused this Lambda function to be triggered
    var src_bkt = event.Records[0].s3.bucket.name;
    var src_key = event.Records[0].s3.object.key;

    // Retrieve the object
    s3.getObject({
        Bucket: src_bkt,
        Key: src_key
    }, function(err, data) {
        if (err) {
            console.log(err, err.stack);
            callback(err);
        } else {
            console.log("Raw text:\n" + data.Body.toString('ascii'));
            callback(null, null);
        }
    });
};

许多海报都要求用Java中的等价物,所以这里有一个例子:

package example;

import java.net.URLDecoder;

import com.amazonaws.services.lambda.runtime.Context;
import com.amazonaws.services.lambda.runtime.RequestHandler;
import com.amazonaws.services.lambda.runtime.events.S3Event;
import com.amazonaws.services.s3.AmazonS3;
import com.amazonaws.services.s3.AmazonS3Client;
import com.amazonaws.services.s3.event.S3EventNotification.S3EventNotificationRecord;

public class S3GetTextBody implements RequestHandler<S3Event, String> {

    public String handleRequest(S3Event s3event, Context context) {
        try {
            S3EventNotificationRecord record = s3event.getRecords().get(0);

            // Retrieve the bucket & key for the uploaded S3 object that
            // caused this Lambda function to be triggered
            String bkt = record.getS3().getBucket().getName();
            String key = record.getS3().getObject().getKey().replace('+', ' ');
            key = URLDecoder.decode(key, "UTF-8");

            // Read the source file as text
            AmazonS3 s3Client = new AmazonS3Client();
            String body = s3Client.getObjectAsString(bkt, key);
            System.out.println("Body: " + body);
            return "ok";
        } catch (Exception e) {
            System.err.println("Exception: " + e);
            return "error";
        }
    }
}

答案 1 :(得分:14)

您可以使用data.Body.toString('ascii')来获取文本文件的内容,假设文本文件使用ascii格式进行编码。您还可以将其他编码类型传递给该函数。查看Node-Buffer了解更多详情。

答案 2 :(得分:5)

我在python 3.6环境中使用lambda函数。 以下代码将读取存储桶my_s3_bucket中文件main.txt的内容。请确保根据需要替换存储桶名称和文件名。

def lambda_handler(event, context):
    # TODO implement
    import boto3

    s3 = boto3.client('s3')
    data = s3.get_object(Bucket='my_s3_bucket', Key='main.txt')
    contents = data['Body'].read()
    print(contents)