Question

我的数据框是我从.csv文件中获得的调查数据。其中一个栏目是年龄，我希望删除所有18岁以下的受访者。然后我需要将年龄组（18-24岁，25-35岁等）分成他们自己的数据帧，我可以为其做频率分布。

x.sub <- subset(x.df, y > 2)

但我无法弄清楚如何使用r（）函数将我的数据帧变量从python变为R语句。感觉好像在rpy2 DataFrame类中应该有一个.subset（）函数。但如果它存在，我找不到它。

Answer 1

使用rpy2 2.2.0-dev（应与2.1.x相同）

from rpy2.robjects.vectors import DataFrame
dataf = DataFrame.from_csvfile("my/file.csv")

dataf_subset = dataf.rx(dataf.rx2("age").ro >= 18, True)

一个确切的例子不在文档中（可能应该在那里），但它的构成要素是：extracting elements和R operators on vectors