我在数据集中有一个列有很多字符串我需要一个得分或评估的模型,或者得到字符串相互重复的次数的百分比。
答案 0 :(得分:2)
您在寻找字符串的频率分布吗?一个简单的R脚本可以很快完成。因此,在Azure ML中,您可以拖放执行R模块并使用类似于以下脚本的脚本
X = C(" A"" A"" A"" B"" B&#34 ;," C"" d"" d&#34)
摘要(as.factor(X))
A B C D
3 2 1 2