PANDAS:如何pd.read_csv并将7位整数分成4乘3整数?

时间:2016-04-15 12:11:33

标签: python csv numpy pandas matplotlib

我是蟒蛇和熊猫的菜鸟,但我希望尽我所能在这里学习,如果我犯了任何错误,请原谅我。

我需要帮助。我的目标是在25414长列表中绘制包含多个绘图数据的csv数据。为了做到这一点,我需要确定哪个Plot编号和哪些数据(Plot Data)从csv文件转到Plot Number(即Heading)。之后我将使用Matplotlib和Numpy绘制所有图形,共享相同的轴,如图所示。 Plot image sample

1.我有一个传感器生成的csv文件,格式如下: -

  • 原始数据= 8790203
    • 8790 = Plot Number(pandas dataframe header)
    • 203 =绘图数据(绘图数据)

csv中的数据长达25414。 Click here to download csv raw data.....

目标清单结果:

[Plot Number]    [Plot Data]
8790             203
8790             205
8790             210
8791             060
8791             065
8791             090

我使用PANDAS的原因是因为它很快。我已经尝试过这段代码来切片数据但需要永远完成(由于错误或切片效率低,我不确定)。

for x in range(0,len(factor),+1):
y = factor.iloc[x]
PlotNum = y[:4]
PlotData = y[5:]

谢谢。

2 个答案:

答案 0 :(得分:2)

使用read_fwf并将列宽传递给参数file_get_contents("http://localhost:8080/test.php"); $receivedCookies = array(); $headerCount = count($http_response_header); for($i = 0; $i < $headerCount; $i++){ if(strpos($http_response_header[$i], "Set-Cookie") !== false){ $receivedCookies[] = $http_response_header[$i]; } } var_dump($receivedCookies); ,设置widths并传递所需列名称的列表:

header=None

答案 1 :(得分:0)

为了高效优化使用read_csv,请使用算术 分割数字和数据:

In [10]: df=pd.read_csv('trace_ff_ID(360).csv',header=None)

In [11]: df2=pd.DataFrame({'Plot Number':df[0]//1000,'Plot Data':df[0]%1000})

整个过程需要100毫秒。