网络分析

时间:2012-12-05 19:18:07

标签: networking graph social-networking data-mining information-retrieval

我的网络问题。 对于一份文件,我正在提取一些信息。我为他们绘制了很好的图表。但在文档信息流中。我试图在图表中描绘它,就像人们阅读文本流动的方式,然后重要的是大多数实体,然后是下一个重要的实体。

要理解和掌握这个问题,我必须研究什么类型的东西,或者网络理论或图论的哪个方面处理它。

如果有人可以提及。 个REG, SK。

1 个答案:

答案 0 :(得分:1)

首先,我不是语言学或语言学专家。我想我明白你要做什么,我不知道最好的方法是什么。

如果我做对了,你想确定一些关键词的中心度量(这可以解释社交网络参考),找到那些与他人联系最多的人,是吗?

如果你尝试这个问题就是你肯定会发现最核心的词是最有意义的词(如果,那么,一些冗余的形容词......),如果你不应用标记化和lemization程序事先。因此,您只能将名词与所使用的动词的词干分开,然后只有您可以尝试自己的方法。

你必须记住的另一个问题是,单词的存在和稀有性都很重要(例如,参见tf-idf weight measure)。

总而言之,我在google上进行了以下搜索:

n gram图语言中心词

发现这篇文章看起来很有意思(我可能会自己看一下!):

LexRank: Graph-based Lexical Centrality as Salience in Text Summarization

相关问题