SAS HTPMINE将ouptut写入与输入相同的文件

时间:2017-10-26 06:58:56

标签: sas text-mining stemming

在SAS中使用hptmine程序,是否可以将输出写入同一文件或以与Stemming操作完成后输入相同的格式写入文件

1 个答案:

答案 0 :(得分:0)

似乎不可能。词干是解析hptmine过程阶段的一部分。根据{{​​3}},parse语句的唯一输出数据集包含完成词干操作后的完整术语列表,是OUTTERMS=数据集。

相反,要在原始文件中替换其词干的术语,您可以在遵循OUTTERMS=过程的sas代码中使用hptmine数据集。

例如,创建一个字典:

proc sql;
create table work.child_parent as
select child.term as term_child, parent.term as term_parent
from OUTTERMS child
inner join OUTTERMS parent 
on child.parent = parent.key
where child._ispar="." and child.role ne "NOUN_GROUP"
;
quit;

并将字典用作代码中的查找表,该代码遍历原始文本文件,并替换每个遇到term_child的词干 - term_parent