我有一个关于文本处理的任务,我不知道如何将来自不同表的一些列合并到一个表中
所以情况如下:
我有一个名为list
的表格,其中包含id_doc
和title
列
然后我创建一个名为term_list
的新表,其中包含一个结果术语列表,当我对list
的标题进行一些文本处理时。
term_list
表包含id_term
,term
,df
和idf
列。最后,我想要一个名为term_freq
的表,其中包含id
,id_term
,id_doc
,tf
和normalized_tf
示例:
表list
是这样的:
id_doc titles
11 information retrieval system
12 operating system
13 business information
表term_list
位于此之下:
id_term term df idf
21 information 2 --
22 retrieval 1 --
23 system 2 --
24 operating 1 --
25 business 1 --
我想问一下如何创建一个表term_freq
,以便表格变成这样?
id id_term id_doc tf normalized_tf
31 21 11 1 --
32 22 11 1 --
33 23 11 1 --
34 24 12 1 --
35 23 12 1 --
36 25 13 1 --
37 21 13 1 --
主要问题是我必须将id_term
和id_doc
加入一个表{1}}与多个id_doc
有关,但我不知道如何关联因为id_term
和list
没有任何相似的列。
请帮助:(
答案 0 :(得分:0)
您可以在term_list
中迭代行:
SELECT id_term, term FROM term_list
为每个term
制作:
SELECT id_doc FROM list WHERE titles LIKE "term"
并将对id_term
和id_doc
保存在表term_freq
中。