我正在制作倒排索引。为此,我从文件中获取值。文件的每个值都是以下形式:
DOCUMENT_ID' \吨' term_Id' \吨' POS_1' \吨' POS_2 ...' \吨' pos_n
这是一个正向索引表示。我想将它转换为反向索引,它应该看起来像
term_Id' \吨'" DOC_ID:POS1,POS2 ... posn处"" DOC_ID:POS1,POS2 ... posn处"
为此目的,我使用列表类型的默认字典。这是我的功能:
regmatches(myvec, regexpr("SS.*TX", myvec))
#[1] "SS1G_340TX" "SS2G_340TX"
它给了我一个错误:Str没有方法.append。 我是python的新手。非常感谢任何帮助。
答案 0 :(得分:-1)
您的嵌套defaultdict
会使nestedDict[...][...]
成为list
,但您会为其指定一个字符串。我不认为你还需要这个任务:为什么不让循环处理所有的位置?