从Excel上载到Exact Online项目中删除HTML字符

时间:2017-05-22 12:23:51

标签: excel invantive-control

我有一个电子表格,其中包含要上传到Exact Online的项目。许多项目仍然包含大量HTML的文章说明,例如:

<p><span style=""font-size: 12px""><span style=""font-family: verdana, geneva, sans-serif"">text<br />
text&nbsp;max&nbsp;text<br />
text</span></span></p>

我试图手动替换所有出现并使用Excel查找/替换,但它涉及数千篇文章。

是否有可能使用Invantive SQL删除这些特殊字符并获取纯文本?

1 个答案:

答案 0 :(得分:1)

处理此类场景的最佳方法是将Excel范围定义为命名范围或Excel表格。

我们假设Excel范围被命名为“MYDATA”。

然后在Invantive SQL中输入:

select xmldecode /* Replace &amp; by & etc. */
       ( replace /* Remove line feeds for exact online when not desired. */
         ( regexp_replace /* Remove all other XML/HTML tags. */
           ( regexp_replace /* Replace line break in HTML by a line feed. */
             ( COLUMN
             , '<br/>'
             , chr(10)
             )
           , '<[^>]*>'
           , ''
           )
         , chr(10)
         , ' '
         )
       )
from   MYDATA@ic

当然,你可以这样做:

insert into exactonlinerest..items(columns) select ... -- see above