r - AzureML：尝试为子集而不是整个数据集

非常感谢发布这个例子 - 这真的有助于理解这个问题。我怀疑您希望通过向每个调用添加参数“gsub()”来修改脚本中的fixed=TRUE调用。（此功能的文档为here。）

似乎已经发生的事情是，在您的完整数据集中的某个地方 - 但不在子采样数据集中 - 有一些文本最终被包含在df[i, "names"]中作为“(art.”。您的脚本将其填入“\\b(art.\\b”。 gsub()函数尝试将其解释为正则表达式而不是简单字符串，然后抛出错误，因为它不是有效的正则表达式：它包含一个左括号但没有右括号。我相信您实际上不希望gsub()首先将输入解释为正则表达式，而指定gsub(..., fixed=TRUE)将会纠正该错误。

我相信当您添加示例/分区模块时此错误消失的原因是，偶然地，在子采样中丢弃了有问题的输入值。我认为这不是Azure ML上可用资源的问题。（警告：我无法确认修复程序是否正常;我已建议更新并开始运行实验，但尚未成功完成。）

AzureML：尝试为子集而不是整个数据集

1 个答案: