我正在使用rpy2中Rand Wilcox提供的可靠统计数据包,并且在运行用于比较n组的可靠测试时遇到了障碍。
以下函数采用一个DataFrame,据我从文档中得知,整数表示因变量和组分配的列:
wilcox.btrim(df,g=2,dp=1)
当我从rpy2运行它时,出现错误:
Error in sqrt(e.pow) : non-numeric argument to mathematical function
如果作为第一个也是唯一的输入,我传递了一个列表列表或一个df,其中每一列都包含组值,则会发生相同的错误。这两种都是调用该函数的合适方法。
这是我的数据框:
x = [1, 2, 3]
x = random.choices(x, k=150)
y = np.random.normal(0, 1, 150)
df = pd.DataFrame({
'dependent_variable': y,
'group_labels': x
})
df.head(10)
dependent_variable group_labels
-1.258020 1
0.357578 3
0.809774 1
0.330426 3
-0.210970 2
这是获取软件包的方法,以便您能够重现错误:
import pandas as pd
import rpy2.robjects as robjects
import random
import numpy as np
from rpy2.robjects import pandas2ri
from urllib.request import urlopen
from rpy2.robjects.packages import SignatureTranslatedAnonymousPackage
pandas2ri.activate()
url = urlopen('https://dornsife.usc.edu/assets/sites/239/docs/Rallfun-v35.txt')
string = b''.join(url.readlines()).decode()
wilcox = SignatureTranslatedAnonymousPackage(string, "wilcox")
有什么想法吗?