我想从两组数据文件(txt和csv)中生成一个图形,我遇到了一些使用R或Python的问题,如果有人可以提供帮助,我会非常感激:)
如何导入数据集以及如何在每个数据集中选择特定列(它与处理一个文件时是否完全相同)?
其中一个文件的数据点数远多于另一个(3 600 000 vs 80 000)。如何选择csv文件中的每第n行?
我很感激R或python中的任何帮助
答案 0 :(得分:1)
好的,尽我所能解决这些问题但没有你尝试过的那些没有成功的例子...
如何导入数据集以及如何在每个数据集中选择特定列(与处理一个文件完全相同)?
您需要单独导入每个文件。假设您的文件有标题,例如
d1 <- read.csv("your_file1_name.csv", headers=TRUE)
d2 <- read.csv("your_file2_name.csv", headers=TRUE)
如果您的标题命名有用的名称(例如&#34; Time&#34;,&#34; 88height&#34;,&#34;章鱼数#34;等),您的数据框将具有相同的名称在通过make.names()
运行标题后,列名称将标题转换为合法的R数据框列名称。
e.g。
d1$Time
d1$number.of.octopus
d2$X88height
如果您希望将数据框合并为一个大数据框,请使用rbind()
。
如果您想要每个数据框中特定列的所有数据的向量,请使用c()
e.g。
total.octopus <- c(d1$number.of.octopus, d2$number.of.octopus)
其中一个文件的数据点比另一个(3 600 000 vs 80 000)多得多。如何选择csv文件中的每第n行?
要选择每个第9行,例如d1,您需要编号:
idx <- seq(1, nrow(d1), by=9)
d1_samp <- d1[idx,] #note the comma and blank - means "every column"
由于缺乏示例,这只是我对您需求的解释。如果它没有回答您的问题,那么如果您发布我们可以运行代码的示例或玩具示例,那么您将更快地到达那里,以显示您尝试过的内容。例如,您想要制作什么样的图表?散点图?趋势? BARCHART?什么样的数据?时间序列?数-VS-类别?等。