我尝试将使用pandas数据框创建的csv文件导入gephi,但是该文件没有显示出异常。
我用python熊猫制作了一个数据框并以这种方式导出。
df.to_csv("df_gephi.csv", encoding="utf_8")
*我也尝试过encoding="utf_8_sig"
。
然后我使用“ utf-8”文件选项将文件导入了gephi,但是可视化时所有字符都变成了正方形。 任何提示将不胜感激。
我还有另外一个要与gephi一起使用的数据集。
DATA1
DATA2
答案 0 :(得分:0)
没有完全回答您的问题,但是您可以尝试通过将网络数据(您的数据帧,称为df
)转换为带有权重的边列表(如果您的数据中有边权)来尝试一下使用networkx。然后,您可以将该文件另存为graphml文件,可以在Gephi中打开它而没有任何问题。
对于边缘列表,您需要具有权重(如果存在)的源节点和目标节点。 df中的每一行都必须在单独的列中包含源节点和目标节点信息。
import networkx as nx
df_network = nx.from_pandas_dataframe(df,source='Src', target='Dst', edge_attr=["weight"], create_using=nx.DiGraph())
nx.write_graphml(df_network,'movement_net_charite.graphml')
在此示例中,我将源节点数据存储在名为'Src'
的列中,将目标节点数据存储在'Dst'
中,并将权重存储在'weight'
列中。