使用python从excel csv文件中提取数据

时间:2019-07-05 03:51:48

标签: python scripting

我在从database1.csv文件提取数据时遇到问题。我的database1.csv文件包含一百万个数据,我需要提取出我需要的某些数据列。下图是我的编码,运行编码时发现错误。我得到的错误是错误:未知方言。

供您参考: 1)我需要从database1.csv文件中提取出包含信息“ GWM”的整个特定列。 2)提取数据后,需要将所有数据放入一个新的excel文件即result.csv文件中。 3)“ GWM”一词是我选择用来提取整个特定列的词

任何推荐的建议都可用于改进和编辑我的编码?谢谢。

import pandas as pd
input_file = pd.read_csv("database1.csv")
output_file = open('result2.csv','w')
for column in input_file:
    count = 0
    for word in column:
        if word == "GWM":
            count = count + 1
print (column)
output_file.write(column)

1 个答案:

答案 0 :(得分:2)

我可以为读取/操作csv数据提供的一个很好的建议是熊猫。例如,使用熊猫读取数据非常简单:

import pandas as pd
df = pd.read_csv( "my/path/to/database1.csv" )

结果是一个数据框。数据的表格表示形式,可以通过多种方式进行操作。写入csv也是另一种方式。您可以使用以下内容:

df.to_csv( "my/path/to/output.csv" )

还有其他一些可用于处理excel数据的方法,例如pd.read_excel和df.to_excel。更多可用的here。希望这会有所帮助。