带有HTML标签的C#

时间:2013-08-07 11:19:10

标签: c# html string html-parsing

我有一个网站,它将使用PHP读取特定的XML样式文件并显示一些内容。更新网站的人并不是那么精通技术,因此我希望创建一个将Powerpoint转换为我正在寻找的XML类型的程序。

我转换PowerPoint - > RTF - > HTML。示例输出如下:

<p style="text-align:center;"><span style="background-color:#FFFFFF;font-family:Calibri font-size:44pt;">Title 1</span></p>
<p><span style="background-color:#FFFFFF;font-family:Calibri;font-size:32pt;">Data in here.</span></p>
<p>&nbsp;</p>
<p><span style="background-color:#FFFFFF;font-family:Calibri;font-size:32pt;">More Data.</span></p>
<p>&nbsp;</p>

我希望逐行读取此HTMl,解释标签并从数据中创建自己的文件。

I.e:每个带有特定标记的标记都会被归类为标题,然后任何带有其他特定标记的标记都将被归类为数据。

示例Ouptut:

<FILE>
    <ITEM>
        <TITLE>Title 1</TITLE>
        <DATA><p>Data in here</p><p>&nbsp;</p><p>More Data.</p></DATA>
    </ITEM>
</FILE>

(如何)可以做到这一点?

注意: 我不是在寻找如何删除所有代码:Like hereand here

注2: Powerpoint没有固定的字体/字体大小。如果可能的话,我希望它完全独立。如果这不起作用,是否可以使用PowerPoint中的固定模板来完成,因此每个标题和数据部分都是相同的,因此具有相同的标签?

1 个答案:

答案 0 :(得分:0)

您是否考虑使用WYSIWYGCKEditor这样的TinyMCE插件?这就是他们的意思:“非技术”人。它们非常容易实现,而您需要做的就是保存到XML中的所有内容都将从textarea元素中获取字符串。我不知道您的项目或者您是否有其他使用PowerPoint的原因,但我认为您需要付出巨大的努力来提出比PPT中的这些插件更好的东西。