在计算值之前从配对行中删除重复项

时间:2017-01-25 03:56:35

标签: python sqlite pandas matplotlib

我有一个Python程序,我试图从CSV转换为SQLite,除了删除重复计数条目之外,我已经设法做了一切。我的数据库是JOINed。我正在读这样的数据库:

Html.LinkFor( c => model )

我试过了df = pd.read_sql_query("SELECT d.id AS is, mac.add AS mac etc etc

df.drop_duplicates('tablename1','tablename2')

但它似乎不起作用。

以下代码是我使用的CSV版本&我想复制Python SQLite脚本。

 df.drop_duplicates('row[1],row[3]') 

3 个答案:

答案 0 :(得分:1)

您是否尝试过首先运行SELECT DISTINCT col1,col2 FROM table

在您的情况下,它可能就像在列名前放置DISTINCT关键字一样简单。

答案 1 :(得分:1)

您需要使用subset参数

df.drop_duplicates(subset=['tablename1','tablename2'])

答案 2 :(得分:1)

谢谢piRSquared,遗漏的子集就是我所需要的,谢谢。

您需要使用subset参数 df.drop_duplicates(子集= [ 'tablename1', 'tablename2'])

还将研究SELECT DISTINCT,但目前,子集可以工作。