我有一个字典,他们的密钥是我希望在元素中保存链表的一个单词,就像这样。
词典
我已经使用数组
dictionari={}
for textoactual in texto:
archi = open(textoactual,'r')
lines = archi.readlines()
for row in lines:
for word in row.split(' '):
if word in dictionari:
aux = dictionari[word]
aux_txt = textoactual.replace('.txt','')
if not(aux_txt in aux):
aux.append(aux_txt)
dictionari[word]=aux
else:
aux_txt = textoactual.replace('.txt','')
dictionari[word] = makelist(aux_txt)
答案 0 :(得分:2)
EDIT3 这可能来得太晚,因为这个问题在一个月前被接受了,但我还有一件事需要补充。
事实上,Python有一个标准的C-ish链表实现,它是deque
模块中的collections
类。这是source
dequeobject
由block
节点的双向链接列表组成。
因此,如果您需要Python中的快速链接列表,请使用deque
。
EDIT2 基于OP的评论。
...因为我希望看到什么是更快的链表或数组 搜索信息
链表中的搜索复杂度等于数组(或基于数组的结构)中的搜索复杂度,大约为O(n),其中n是容器中元素的数量。但是,由于Python内置数据结构经过大量优化和C加载,因此它们在实际使用中运行速度要快得多。如果您需要在列表的任何位置插入/删除不间断的时间,或者您不想使用动态大小的数组,那么链接列表会很有用,但它看起来并不像您的情况。由于您实际上在寻找快速搜索,因此需要哈希表,因此使用set
来存储文件名。为此,请替换match_words_and_files
res.setdefault(word, llist.LinkedList()).insert_with_lookup(file_title)
与
res.setdefault(word, set()).add(file_title)
修改即可。 OP更新了请求。如果LinkedList
内容保存在名为llist
的单独模块中:
import os
import llist
def match_words_and_files(directory):
directory = os.path.abspath(directory)
res = {}
for file_name in filter(os.path.isfile, os.listdir(directory)):
file_title = os.path.splitext(file_name)[0]
with open(os.path.join(directory, file_name)) as inp:
for line in inp:
parsed_line = line.rstrip().split()
for word in parsed_line:
res.setdefault(word, llist.LinkedList()).insert_with_lookup(file_title)
return res
原帖。
如果你想在Python中使用链表,可以用这种方式实现(显然这不是唯一的方法)
class Node(object):
__slots__ = ["_data", "_next_node"]
def __init__(self, data, next_node=None):
self._data = data
self._next_node = next_node
def __str__(self):
return str(self._data)
def __repr__(self):
return repr(self._data)
@property
def data(self):
return self._data
@property
def next_node(self):
return self._next_node
def link_node(self, next_node):
if not hasattr(next_node, "_next_node"):
self._next_node = Node(next_node)
self._next_node = next_node
class LinkedList(object):
def __init__(self, head=None):
if head is not None and not isinstance(head, Node):
self._head = Node(head)
else:
self._head = head
def __repr__(self):
return repr([repr(node) for node in self.iter_links()])
def __str__(self):
return ','.join(str(node) for node in self.iter_links())
def __len__(self):
return sum(1 for _ in self.iter_links())
def set_head(self, head):
self._head = head
def insert(self, node):
if not isinstance(node, Node):
node = Node(node)
node.link_node(self._head)
self._head = node
def insert_with_lookup(self, node):
"""
Inserts a node if the data it contains is not equal to the one
stored in the the head node.
"""
if not isinstance(node, Node):
node = Node(node)
if node.data != self._head.data:
self.insert(node)
def iter_links(self):
current_node = self._head
while current_node:
yield current_node
current_node = current_node.next_node
linked_list = LinkedList(1)
linked_list.insert(2)
linked_list.insert(3)
让我们创建一个并稍微增长
print(list(linked_list.iter_links()))
输出:
[3, 2, 1]
P.S。
在您的案例中,我没有看到使用链接列表的单一理由。