请帮助。我正在尝试做一些认为应该直接的事情。我有一个名称列表和一个组织从属关系,我要在上面进行社交网络分析。实际上,每个人都是一个节点,他们共享的组织成员身份是边缘。
我有一个大约110,000个名称的列表,这些名称是我从CSV文件中读取的。我要执行以下操作: -进行一些数据清理(从组织描述字符串中删除停用词列表。 -创建一个包含三列的有序列表(人员A的名称,人员B的名称,共享组织的名称 -使用igraph插件生成网络分析。
我什至不能做第一个。我尝试遍历每个单元格并获得一个永无止境的错误序列。
我正在使用R。我打算在Python中执行此操作,但无法解决NetworkX工具的问题。从字面上看是行不通的!请告诉我该怎么做!我不敢相信简单地引用R中矩阵中的单个单元格有多复杂!
我无法使用的代码示例。取而代之的是,“ p”成为所有110,000个元素的单个字符串。
BoardData <- read_csv("C:/R_Projects/NetworkAnalysis/BoardList.csv")
StringData <- BoardData["Board_Seats"]
CleanData <- list()
index = 0
temp = lengths(BoardData["Board_Seats"])
for (p in BoardData["Board_Seats"])
{
index = index+1
temp = p
CleanData[[index]] <- removeWords(temp,stopwords)
}
我无法使用的代码示例。取而代之的是,“ p”成为所有110,000个元素的单个字符串。无论我如何尝试,我都无法遍历循环。
请帮助。