我有这种数据框(〜7000行):
import os
# iterate over your files
for fileName in os.listdir():
newName = fileName[:-13].replace('_', ':') + fileName[-13:]
os.rename(fileName, newName)
# 'HARPS.2010-10-19T02:24:55.819_e2ds_A.fits'
# 'HARPS.2016-01-20T00:38:12.300_e2ds_A.fits'
# 'HARPS.2015-11-26T04:30:27.879_e2ds_A.fits'
我想从中获得一个分布图。因此,我试图获取X轴(但按相关间隔分组)的第一列的值和Y轴的第二列的值。
我尝试使用> head (Distrib)
Length Number_of_occurences
60 12
62 52
64 1
70 3
71 12
72 82
中的参数'names',但是它不起作用,因为我希望R计算发生频率并设定相关间隔。
我也尝试使用barplot()
,但由于第二行已计入每次重复,所以它不起作用。
我也尝试过hist()
的ggplot:
ggplot2
但是结果不是很好,可能是因为数据帧有很多行。