将SQLite数据库转换为三元组存储

时间:2011-01-24 08:17:43

标签: sqlite relational-database triplestore

有人可以描述将SQLite数据库转换为三重存储所需的步骤吗?

是否有可以完成任务的工具?

2 个答案:

答案 0 :(得分:4)

这是一个更复杂的问题,当我问它时,似乎是一个更复杂的问题,但简单的答案是你完全正常化你的数据库。在完全规范化之后,每个表代表一个谓词,一个列值代表主题,一个列值代表该对象。您可以在此基础上将任意sql数据库转换为triplestore。

答案 1 :(得分:0)

函数转换将任何类型的关系数据三重转换为三重格式:

   def transform_to_triple(source,db_name,table,result):
    #get the list of relations for the selected DB
    max_records = 100
    response = []
    x_print = lambda *x : response.append("(%s)\n" %("".join(["%s"%(v) for v in x])))

    id = 1

    x_print(id,',(db_name:string),',db_name)
    logger.info("(%s,(db_name,string), %s)" %(id,db_name))

    tables = []
    table_list = [table,]
    for i, _table in enumerate(table_list):
        _table_id = id + i + 1
        x_print(id,',(rel:id),', _table_id)
        logger.info("(%s,(rel, id), %s)" %(id, _table_id))

        _schema = get_column_list(source, db_name,_table)
        tables.append((_table_id, _table, _schema))
    for _table in tables:
        _table_id = _table[0]
        x_print(_table_id,',(rel_name:string),',_table[1])
        for j,row in enumerate(result):
            #lets assume there is always less than 10 k tuples in a table
            _tuple_id = _table_id * max_records + j + 1
            x_print(_table[0],',(tuple:id),', _tuple_id)
            logger.info("(%s,(tuple, id), %s)" %(_table[0],_tuple_id))
        for j,row in enumerate(result):
            _tuple_id = _table_id * max_records + j + 1
            for k,value in enumerate(row):
                x_print(_tuple_id, ",(%s : %s)," %(_table[2][k][0], _table[2][k][1]), value)   
    return "%s" %("".join(response))

get_column_list函数返回数据库表中的列列表:

def get_column_list(src_name,db_name,table_name):
     cur = get_connect() #Connecting with tool DB
     query = '''select db_name, host, user_name, password from "DataSource" where src_name = '%s' and db_name = '%s' '''%(src_name, db_name)
     cur.execute(query)
     data  = cur.fetchall()
     (db, host, username, password) = data[0]
     _module = get_module(src_name)
     cursor = _module.get_connection(db, host, username, password)
     try:
          _column_query = _module.COLUMN_LIST_QUERY %(db_name, table_name)
     except TypeError, e:
          try:
               _column_query = _module.COLUMN_LIST_QUERY %(table_name)
          except TypeError, e:
               _column_query = _module.COLUMN_LIST_QUERY

     cursor.execute(_column_query)
     column_list = cursor.fetchall()
     return column_list