我有一个列表(> 50,000字)。列表中的每个单词都有一组关联的别名。每个单词平均有5个别名。
我得到一个平均为6个字的输入字符串。我必须这样做:
// Pseudocode
foreach word in input_string
if word == x or word in alias(x) // x is a word in the list
tag (word, x) // Tag word with x
else
tag (word, 0)
end
什么是快速数据结构来维护一个别名列表,以便快速执行上面的查找?