我正在使用以下数据集:https://www.kaggle.com/rdoume/beerreviews 它有150万行。 我正在使用Networkx创建图形,如下所示:
beerid_series = beer_reviews['beer_beerid']
profilename_series = beer_reviews['review_profilename']
beer_review_edges = [(row["beer_beerid"],row["review_profilename"]) for
idx,row in beer_reviews.iterrows()]
BeerGraph = nx.Graph()
BeerGraph.add_nodes_from(beerid_series,bipartite=0)
BeerGraph.add_nodes_from(profilename_series,bipartite=1)
BeerGraph.add_edges_from(beer_review_edges)
并创建投影图,我正在这样做:
Beer_Projected_G = bipartite.projected_graph(BeerGraph, beerid_series)
要创建此投影图,需要花费大量时间。我的代码实现有什么问题吗,或者我必须做些什么来提高计算速度?
谢谢