我的目标是编写智能ChatBot。他应该保存可能存在于人脑中的已知信息。
这就是为什么我正在寻找一个文件类型,它将数据存储为连接关键字的网络。什么文件类型或数据库系统可以达到这个目标?
信息输入将是维基百科,谷歌搜索以及人在对话过程中教导的事实。
我可以提供有关我的要求和愿望的具体信息,但我不知道是否存在任何方法。也许有更多有用的规格作为我的想法。
只是一个例子:连接应该有权重。请求信息网应该增加使用连接的权重。
我期望ChatBot可以使用数据网获得真正的关联(或想法)。
答案 0 :(得分:2)
作为我上述评论的延伸:
图表绝对是你想要的数据表示方式...它完全映射到你的问题描述。
您似乎要问的是如何[持久]将此信息存储在磁盘(而不是内存)上。这完全取决于您需要什么样的约束。有一个“图形数据库”,它比存储关系数据库或分层数据库更适合存储图形,并且比将邻接矩阵或列表推送到平面文件要好得多。这是维基百科条目:
http://en.wikipedia.org/wiki/Graph_database
现在,当你拥有如此多的节点和边缘而无法一次将它们全部加载到内存中时会发生什么问题,不幸的是,如果你有连接到每个其他节点的节点,那么可能是一个问题(因为你无法加载完整/有效的图表。我现在无法回答这个问题,但我确信有解决这个问题的范例。我会在挖掘之后更新我的答案。< / p>
编辑 - 您可能需要咨询更了解图数据库的人。有可能有方法从数据库加载图形块而不加载整个图形。如果这就是您的问题,您可能想要改进一个关于使用存储在图形数据库中的大型图表并重新发布的问题,标记为graphs
,databases
,algorithms
,类似于那,并以更具体的方式再次发布。