从熊猫和绘图中读取csv文件

时间:2016-08-30 15:10:45

标签: python

我有1000个文件,其中的数据以逗号分隔方式存储。 文件的描述如下:

值以逗号分隔,-9999值应忽略 如果可以读取,行和列的所有值都应存储在数字中, 因为它必须用于绘图。 文件的形状为[ 104行x 15列]。

文件的几行如下:

0,   9.8597e+00, 129.944,   1.071, 6.7433e-06, 1.0911e-05,      -9999,      -9999, 3.7134e-07, 3.5245e-05,      -9999,      -9999,  26.295,   -86.822,  -123.017



0,   8.7012e+00, 130.908,   0.966, 1.9842e-06, 1.0799e-05,      -9999,      -9999, 3.5888e-07, 7.8133e-05,      -9999,      -9999,  27.140,   -86.818,  -122.322

读入数值后,我还需要将其绘制到子图中。 像COl1对比Col2,Col3对col5等等......

知道如何实现它吗?

import numpy as np
import pandas as pd 
import matplotlib.pyplot as plt

df1=pd.read_csv("small_file_106.txt",header=1)
print(df1)

2 个答案:

答案 0 :(得分:1)

我从未使用过情节,但是对于第一个问题,以下内容会有用 将值列表输入na_values,这些值将被pandas视为NA

pd.read_csv(File, sep=',',na_values=['-9999'],keep_default_na=False)

此外,pd.to_numeric可用于将数据转换为数字

df.apply(lambda x: pd.to_numeric(x, errors='ignore'))

答案 1 :(得分:0)

一旦你读了数据(Shijo的方法看起来不错),Seaborn library's pairplot就会产生你想要的情节。