我加载了加权图的文本文件。文本文件包含名为“ FromNodeId”,“ ToNodeId”和“ Sign”的三列。标志是边缘的重量。 Sign的值是-1或1。我想找到每个节点的“ Sign = 1”的输出边数(输出度)。 请为我提出解决此问题的方法。
import networkx as nx
G= nx.read_edgelist("soc-sign-epinions.txt",data = [('Sign', int)], create_using=nx.DiGraph())
nodes = G.nodes()
edges = G.edges()
答案 0 :(得分:1)
您可以直接使用熊猫来执行此操作。您可以使用pd.read_csv('path_to_file')读入数据,然后过滤具有正号的边,然后对groupby原点节点进行归并并总结剩余的号。这是伪造数据的示例:
import pandas as pd
data=pd.DataFrame([['a','b',1],
['a','c',-1],
['a','d',1],
['b','a',1],
['b','d',-1],
['c','a',1],
['d','b',1]],
columns = ["FromNodeId", "ToNodeId","Sign"])
data[data['Sign']==1].groupby('FromNodeId')['Sign'].sum()
返回:
FromNodeId
a 2
b 1
c 1
d 1
Name: Sign, dtype: int64
答案 1 :(得分:1)
因此,我们将其分为两个观察结果。首先,我们可以使用G.edges(node, data = True)
访问节点(以及关联的数据)之外的所有边缘。其次,有一些方法可以有效地循环通过仅计算带正号的那些边。更一般而言,这种方法可用于计算具有任何特定属性的节点边缘的数量。
import networkx as nx
G = nx.DiGraph()
G.add_edge(0,2,sign=-1)
G.add_edge(0,1, sign = 1)
G.add_edge(2,3,sign = 1)
G.add_edge(3,0, sign=-1)
print(G.edges(0, data=True))
>[(0, 2, {'sign': -1}), (0, 1, {'sign': 1})]
请注意,此处未出现边(3,0)。因此,G.edges(0, data=True)
会产生从0
开始的边,并包括您已附加到边的数据。 (在最终代码中,显然您实际上并不需要此打印语句)。
现在,我们将在生成器中使用它,并对元素的数量求和。
s = sum(1 for (u,v,d) in G.edges(0, data=True) if d['sign']==1)
print(s)
> 1
我所做的是创建一个生成器,该生成器遍历0
的所有边,如果符号为1
,则将输出加1。
如果最后一句话没有意义,请查看以下答案:https://stackoverflow.com/a/7223557/2966723,以了解发生了什么,有关生成器的更多信息,请从Understanding generators in Python开始。