使用API​​删除Socrata中的数据集附件

时间:2015-08-11 12:45:14

标签: python socrata soda

我正在研究一个python脚本: 1)从企业数据库中提取GIS元数据 2)将元数据从XML解析为纯文本 3)将文本文件附加到Socrata中相应的已发布数据集(每月发布一次) 4)该脚本也将每月运行一次,以便企业数据集中的任何模式更改都反映在Socrata上附加的纯文本元数据文件中。

我已经能够使用找到的here代码成功将文本元数据文件附加到已发布的Socrata数据集。问题是,每次运行脚本时,都会添加一个附加附件。我想删除现有附件并添加新附件,或者用新内容覆盖现有附件。

我已就此进行了大量研究,似乎找不到任何使用Socrata API管理附件的文档。有什么建议?

2 个答案:

答案 0 :(得分:0)

我最终搞清楚了这个。不得不改变几行来清空Socrata Python库中attach_file函数中的附件:

def attach_file(self, filename):
    metadata = self.metadata()
    if not metadata.has_key('attachments'):
        metadata['attachments'] = []

为:

def attach_file(self, filename):
    metadata = self.metadata()
    metadata['attachments'] = []    #empty out metadata, regardless of existing metadata

答案 1 :(得分:0)

使用相同的API结束,并且能够使用以下代码替换附件:

def attach_file(self, filename, clear_metadata):
    metadata = self.metadata()
    if not metadata.has_key('attachments'):
        metadata['attachments'] = []
    # if the user wants to clear all existing attachments on dataset
    if clear_metadata:
        metadata['attachments'] = []
    response = self.multipart_post('/assets', filename)
    if not response.has_key('id'):
        print "Error uploading file to assets service: no ID returned: %s" % response
        return
    attachment = {'blobId': response['id'],
        'name': response['nameForOutput'],
        'filename': response['nameForOutput']}
    metadata['attachments'].append(attachment)
    self._request("/views/%s.json" % self.id, 'PUT', {'metadata':metadata})

def multipart_post(self, url, filename, field='file'):
    print("Running multipart_post")
    authBase64 = base64.encodestring('%s:%s' % (self.username, self.password)).replace('\n', '')

    datagen, headers       = multipart_encode({field: open(filename, "rb")})
    headers['X-App-Token'] = self.app_token
    headers['Authorization'] = "Basic %s" % authBase64
    print("url=" + url)
    request = Request("%s%s" % (self.url, url), datagen, headers)
    print(str(Request))
    response = urlopen(request).read()
    return json.loads(response)