如何使用C#从破碎的XML中删除所有命名空间?

时间:2013-01-04 09:26:12

标签: c# xml wordpress xml-namespaces

Here是如何从xml中删除所有命名空间的。但这对我不起作用。因为有时我会破坏xml feed。例如:

<?xml version="1.0" encoding="UTF-8"?>
<!-- generator="wordpress.com" -->
<rss version="2.0"
  xmlns:atom="http://www.w3.org/2005/Atom"
  xmlns:dc="http://purl.org/dc/elements/1.1/"
  xmlns:opensearch="http://a9.com/-/spec/opensearch/1.1/">
<channel>
  <title>sabri ?lker - WordPress.com Search</title>
  <link>http://tr.search.wordpress.com/?q=sabri+%C3%BClker&#038;page=2&#038;t=comment&#038;s=date</link>
  <description>sabri ?lker - WordPress.com Search</description>
  <pubDate>Fri, 04 Jan 2013 08:58:41 +0000</pubDate>
  <language>tr</language>
  <image><url>http://s.wordpress.com/i/buttonw-com.png</url><width>224</width><height>58</height><title>WordPress.com</title><link>http://wordpress.com/</link></image>
  <generator>http://search.wordpress.com/</generator>
  <atom:link rel="self" type="application/rss+xml" href="http://tr.search.wordpress.com/?q=sabri+%C3%BClker&#038;page=2&#038;t=comment&#038;s=date&amp;f=feed" />
  <atom:link rel="search" type="application/opensearchdescription+xml" href="http://en.search.wordpress.com/opensearch.xml" title="WordPress.com" />
  <opensearch:totalResults>10</opensearch:totalResults><opensearch:startIndex>11</opensearch:startIndex><opensearch:itemsPerPage>10</opensearch:itemsPerPage><opensearch:Query role="request" searchTerms="sabri ?lker startPage=\"2" /></channel>
</rss>

我的例句是“姓名不能以'2'字符开头,十六进制值为0x32。第17行,第227位。”结果。那么我该怎么做才能解决这个问题。

1 个答案:

答案 0 :(得分:0)

我说原因是形式不正确的searchTerms属性:

searchTerms="sabri ?lker startPage=\"2"  

它引用了错误的方式它应该使用&amp; quot;而不是\“。你可以简单地用&amp; quot;

替换所有\”
string input = ..; // your xml
string processedInput = input.Replace("\\\"", "&quot;");

// then feed this into your xml parser.

这应该可以解决您的问题,但它当然不是消除错误的xml输入的一般方法。您可能希望查看http://tidyfornet.sourceforge.net/它可以清理HTML,XHTML和XML。