我有1000个文件,其中的数据以逗号分隔方式存储。 文件的描述如下:
值以逗号分隔,-9999
值应忽略
如果可以读取,行和列的所有值都应存储在数字中,
因为它必须用于绘图。
文件的形状为[ 104行x 15列]。
文件的几行如下:
0, 9.8597e+00, 129.944, 1.071, 6.7433e-06, 1.0911e-05, -9999, -9999, 3.7134e-07, 3.5245e-05, -9999, -9999, 26.295, -86.822, -123.017
0, 8.7012e+00, 130.908, 0.966, 1.9842e-06, 1.0799e-05, -9999, -9999, 3.5888e-07, 7.8133e-05, -9999, -9999, 27.140, -86.818, -122.322
读入数值后,我还需要将其绘制到子图中。 像COl1对比Col2,Col3对col5等等......
知道如何实现它吗?
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
df1=pd.read_csv("small_file_106.txt",header=1)
print(df1)
答案 0 :(得分:1)
我从未使用过情节,但是对于第一个问题,以下内容会有用 将值列表输入na_values,这些值将被pandas视为NA
pd.read_csv(File, sep=',',na_values=['-9999'],keep_default_na=False)
此外,pd.to_numeric可用于将数据转换为数字
df.apply(lambda x: pd.to_numeric(x, errors='ignore'))
答案 1 :(得分:0)
一旦你读了数据(Shijo的方法看起来不错),Seaborn library's pairplot就会产生你想要的情节。