什么样的数据结构适合Facebook模型用户

时间:2018-11-29 03:44:54

标签: c++ algorithm performance data-structures performance-testing

我想为这种情况建立有效的数据结构:
用户很多,每个用户都有一个ID和一个名称。每个用户都可以关注其他人。我需要处理四种命令:create-user,follow,delete-user和cancel-follow。这是一个示例:

create-user id=3 name="Chandler"
create-user id=7 name="Janice"
create-user id=2 name="Joey"
follow id=3 id=7     # Chandler follows Janice
follow id=7 id=3     # Janice follows Chandler
follow id=2 id=7
follow id=7 id=2
delete-user id=7
follow id=3 id=2
follow id=2 id=3
cancel-follow id=3 id=2

总之,我需要读取一个文件,其中包含许多上述命令并处理所有数据。

这是我尝试过的(处理四种命令的功能):

struct User
{
    unsigned long id;
    string name;
    unordered_set<User *> followers;
    unordered_set<User *> fans;

    User(unsigned long pid, const string & pname) : id(pid), name(pname) {}
};

list<User> users;

User & getUserById(list<User> & users, unsigned long id)
{
    auto it = std::find_if(users.begin(), users.end(), [&](User & u) {return id == u.id;});
    return *it;
}

void createUser(list<User> & users, unsigned long id, const string & str)
{
    users.emplace_back(User(id, str));
}

void deleteUser(list<User> & users, unsigned long id)
{
    auto itUser = std::find_if(users.begin(), users.end(), [&](User & u) {return id == u.id;});
    auto itFans = itUser->fans;
    for (auto it = itFans.begin(); it != itFans.end(); ++it)
    {
        (*it)->followers.erase(&*itUser);
    }
    auto itFollowers = itUser->followers;
    for (auto it = itFollowers.begin(); it != itFollowers.end(); ++it)
    {
        (*it)->fans.erase(&*itUser);
    }
    users.erase(itUser);
}

void buildRelation(list<User> & users, unsigned long follower, unsigned long fan)
{
    User & u1 = getUserById(users, follower);  //3
    User & u2 = getUserById(users, fan);  //7
    u1.fans.insert(&u2);
    u2.followers.insert(&u1);
}

void cancelRelation(list<User> & users, unsigned long follower, unsigned long fan)
{
    User & u1 = getUserById(users, follower);       //3
    User & u2 = getUserById(users, fan);  //2
    u1.fans.erase(&u2);
    u2.followers.erase(&u1);
}

它可以正常工作。

但是,我用我的代码处理了一个文件,该文件包含70000行命令,耗时约67秒。

我真的想获得更好的性能(也许是20秒?),我知道我需要一个更好的数据结构,但是目前我还不知道如何设计一个更好的数据结构。

2 个答案:

答案 0 :(得分:3)

您的输入数据看起来非常适合键,值数据结构,例如std :: unordered_map(https://en.cppreference.com/w/cpp/container/unordered_map

其中id值可以用作存储和检索User数据结构的键。

如果可以将数据处理为类似的结构 std :: unordered_map而不是list 这样,您的getUserById函数就不需要每次都搜索列表来检索用户数据。

答案 1 :(得分:0)

对于用户,我有一个映射类型的数据结构键,名称是值。

将有向图实现为

Graph{ intV;LinkedList<Map<Long,String>>adjList[]; }
  1. 创建用户:
    在图

  2. 中创建一个节点
  3. 关注用户: 创建从该用户到其他用户的定向链接

  4. 删除用户: 使用图遍历技术查找用户并删除节点

  5. 取消-遵循: 从图中删除链接,因为它是有向图

希望有帮助