使用Python在两个SQL数据库之间的多个表中分析数据

时间:2018-08-01 11:42:09

标签: sql python-3.x data-analysis

我得到了两个具有相同模式类型的SQL数据库,但是它们的表名或表中的列名不同。

我需要分析表中的那些数据并建议,这是两个数据库之间相似的(基于表中的数据)表。

有人可以建议我如何继续解决这个问题。 我是使用Python进行数据分析的新手。 如果有人可以帮助我,这将非常有帮助。

作为一个例子:让我们考虑两个数据库A和B。 。 。 包含一个名为“ person_details”的表, B包含一个称为“详细信息”的表

我正在寻找答案,可以通过分析这两个表中可以连接的表中的数据来提出建议。

1 个答案:

答案 0 :(得分:0)

考虑使用python的sqlite包连接到db并在其中查询。 https://docs.python.org/2/library/sqlite3.html

通过查询可以检查表的架构。或者,如果要使用熊猫分析数据,请考虑使用SQLAlchemy创建与数据库的连接。 http://docs.sqlalchemy.org/en/latest/core/engines.html#supported-databases

之后,使用此命令将表读取为pandas DataFrame https://pandas.pydata.org/pandas-docs/version/0.21/generated/pandas.read_sql_table.html

    from sqlalchemy import create_engine
    import pandas as pd

    engine_A = create_engine('sqlite:///sqlalchemy_A.db')
    engine_B = create_engine('sqlite:///sqlalchemy_B.db')

    data_A = pd.read_sql_table("person_details",engine_A)
    data_B = pd.read_sql_table("details",engine_B)

这应该有效。