Question

我正在尝试从JIRA解析xml导出。这是一个例子： https://jira.atlassian.com/si/jira.issueviews:issue-xml/DEMO-4778/DEMO-4778.xml 当我在浏览器中打开它并右键单击 - ＆gt;另存为 - ＆gt; xml然后一切都如预期的那样。但是，当我尝试使用c＃来获取该内容时，这样的节点存在问题：

<description>
<p>Go to the Browser <br/> Open the application<br/> Log In to the page <br/> Click on Categories button<br/> Click on Add button <br/> Not able to add any Category on Categories table <br/> Given me Error Message </p>
</description>

问题是它们内部包含html字符，并且不会转换为c＃world字符。例如：<br/>只是被转义为＆amp; LT峰; br /＆安培; gt; 而不是被视为换行符。当我用浏览器下载并从文件中加载它时，这个问题不存在，有什么区别？

这是我的代码：

 WebRequest request = WebRequest.CreateHttp("https://jira.atlassian.com/si/jira.issueviews:issue-xml/DEMO-4778/DEMO-4778.xml");

                using (WebResponse response = request.GetResponse())
                {
                    using (Stream stream = response.GetResponseStream())
                    {
                        using (StreamReader objReader = new StreamReader(stream))
                        {
                            var serializer = new XmlSerializer(typeof(rss));
                            var rss =(rss)serializer.Deserialize(objReader);
                            var desc = rss.channel.item.description.Text[0];

                        }

                    }
                }

这是一个desc变量内容：

<p>Go to the Browser <br/>
Open the application<br/>
Log In to the page <br/>
Click on Categories button<br/>
Click on Add button <br/>
Not able to add any Category on Categories table <br/>
Given me Error Message </p>

为什么JIRA导出文本中包含html标签？我想我正在做的是获取一个网页而不是它的内容。在浏览器中“另存为xml”幕后做了什么？

JIRA XML Export包含HTML字符

0 个答案: