来自两组具有不同数据点数的数据文件的图表

时间:2018-04-07 23:44:39

标签: python r pandas matplotlib graph

我想从两组数据文件(txt和csv)中生成一个图形,我遇到了一些使用R或Python的问题,如果有人可以提供帮助,我会非常感激:)

  • 如何导入数据集以及如何在每个数据集中选择特定列(它与处理一个文件时是否完全相同)?

  • 其中一个文件的数据点数远多于另一个(3 6​​00 000 vs 80 000)。如何选择csv文件中的每第n行?

我很感激R或python中的任何帮助

1 个答案:

答案 0 :(得分:1)

好的,尽我所能解决这些问题但没有你尝试过的那些没有成功的例子...

  

如何导入数据集以及如何在每个数据集中选择特定列(与处理一个文件完全相同)?

您需要单独导入每个文件。假设您的文件有标题,例如

d1 <- read.csv("your_file1_name.csv", headers=TRUE) d2 <- read.csv("your_file2_name.csv", headers=TRUE)

如果您的标题命名有用的名称(例如&#34; Time&#34;,&#34; 88height&#34;,&#34;章鱼数#34;等),您的数据框将具有相同的名称在通过make.names()运行标题后,列名称将标题转换为合法的R数据框列名称。

e.g。

d1$Time d1$number.of.octopus d2$X88height

如果您希望将数据框合并为一个大数据框,请使用rbind()

如果您想要每个数据框中特定列的所有数据的向量,请使用c()

e.g。

total.octopus <- c(d1$number.of.octopus, d2$number.of.octopus)

  

其中一个文件的数据点比另一个(3 6​​00 000 vs 80 000)多得多。如何选择csv文件中的每第n行?

要选择每个第9行,例如d1,您需要编号:

idx <- seq(1, nrow(d1), by=9) d1_samp <- d1[idx,] #note the comma and blank - means "every column"

由于缺乏示例,这只是我对您需求的解释。如果它没有回答您的问题,那么如果您发布我们可以运行代码的示例或玩具示例,那么您将更快地到达那里,以显示您尝试过的内容。例如,您想要制作什么样的图表?散点图?趋势? BARCHART?什么样的数据?时间序列?数-VS-类别?等。