我正在尝试从JIRA解析xml导出。这是一个例子: https://jira.atlassian.com/si/jira.issueviews:issue-xml/DEMO-4778/DEMO-4778.xml 当我在浏览器中打开它并右键单击 - >另存为 - > xml然后一切都如预期的那样。但是,当我尝试使用c#来获取该内容时,这样的节点存在问题:
<description>
<p>Go to the Browser <br/> Open the application<br/> Log In to the page <br/> Click on Categories button<br/> Click on Add button <br/> Not able to add any Category on Categories table <br/> Given me Error Message </p>
</description>
问题是它们内部包含html字符,并且不会转换为c#world字符。例如:<br/>
只是被转义为&amp; LT峰; br /&安培; gt; 而不是被视为换行符。当我用浏览器下载并从文件中加载它时,这个问题不存在,有什么区别?
这是我的代码:
WebRequest request = WebRequest.CreateHttp("https://jira.atlassian.com/si/jira.issueviews:issue-xml/DEMO-4778/DEMO-4778.xml");
using (WebResponse response = request.GetResponse())
{
using (Stream stream = response.GetResponseStream())
{
using (StreamReader objReader = new StreamReader(stream))
{
var serializer = new XmlSerializer(typeof(rss));
var rss =(rss)serializer.Deserialize(objReader);
var desc = rss.channel.item.description.Text[0];
}
}
}
这是一个desc变量内容:
<p>Go to the Browser <br/>
Open the application<br/>
Log In to the page <br/>
Click on Categories button<br/>
Click on Add button <br/>
Not able to add any Category on Categories table <br/>
Given me Error Message </p>
为什么JIRA导出文本中包含html标签? 我想我正在做的是获取一个网页而不是它的内容。在浏览器中“另存为xml”幕后做了什么?