我面临的当前问题来自以下场景。我有一个运行命令行程序的脚本来查找特定文件夹中某个扩展名的所有文件,让我们调用这些文件文件A.脚本的另一部分通过文件A中文件名的每个文件运行一个grep命令。存储文件A和文件A中文件名的最佳方法,我怎样才能实现?感谢
答案 0 :(得分:2)
最近有一个关于这个问题的问题 - 你建模的结构是有向图。使用Python的my answer包,查看该问题的networkx
。如果要对数据进行一些后处理,使用此包是个好主意。但是,对于简单的情况,您可以创建自己的数据结构。以下是使用图表的邻接列表表示的示例;相反,使用邻接矩阵并不困难。
from collections import defaultdict
adj_list = defaultdict( set )
for filename in os.listdir( <dir> ):
with open( filename ) as theFile:
for line in theFile:
# parse line into filename, say 'target'
adj_list[ filename ].add( target )
这会给你一个文件名字典 - &gt;由该文件链接的文件。