在SAS中使用hptmine程序,是否可以将输出写入同一文件或以与Stemming操作完成后输入相同的格式写入文件
答案 0 :(得分:0)
似乎不可能。词干是解析hptmine
过程阶段的一部分。根据{{3}},parse
语句的唯一输出数据集包含完成词干操作后的完整术语列表,是OUTTERMS=
数据集。
相反,要在原始文件中替换其词干的术语,您可以在遵循OUTTERMS=
过程的sas代码中使用hptmine
数据集。
例如,创建一个字典:
proc sql;
create table work.child_parent as
select child.term as term_child, parent.term as term_parent
from OUTTERMS child
inner join OUTTERMS parent
on child.parent = parent.key
where child._ispar="." and child.role ne "NOUN_GROUP"
;
quit;
并将字典用作代码中的查找表,该代码遍历原始文本文件,并替换每个遇到term_child
的词干 - term_parent
。