使用正则表达式使用SAS DS2删除html元素

时间:2016-06-03 13:50:28

标签: sas

我在尝试使用SAS中的regex删除所有html元素时遇到以下错误。你能告诉我这是什么问题吗?

Data HTMLData;
filename INDEXIN URL "http://www.google.com/";
input;

textline = _INFILE_;
/*-- Clear out the HTML text --*/
re1 = prxparse("s/<(.|\n)*?>//");
call prxchange(re1, -1, textline);
run; 

错误:没有DATALINES或INFILE语句。 错误:已引用 INFILE 变量,但未找到DATALINES或INFILE语句。

1 个答案:

答案 0 :(得分:1)

您有一个filename,但您需要一个infile语句(或另外)。 filename是一个开放的代码语句,它只是在名称文字和文件路径之间建立链接。

filename INDEXIN URL "http://www.google.com/";

Data HTMLData;
  infile indexin;
  input;

  textline = _INFILE_;
  /*-- Clear out the HTML text --*/
  re1 = prxparse("s/<(.|\n)*?>//");
  call prxchange(re1, -1, textline);
run;