如何在文本中查找文件路径?

时间:2012-01-30 17:01:03

标签: c#

情况: 我有一些带有很多linux文件路径的html代码(例如/ home / lol / test)

它需要在C#中用php和html文件完成吗?

2 个答案:

答案 0 :(得分:0)

您应该编写一个Parser类来阅读所有文本并将其拆分为您希望从中获取的部分。

如果您发布HTML的某些部分,则可以更轻松地帮助您。

您可以使用以下内容将HTML作为字符串获取:

    private string GetWebPage()
    {
        string pageSource;
        string getUrl = "http://index.htm";
        WebRequest getRequest = WebRequest.Create(getUrl);
        WebResponse getResponse = getRequest.GetResponse();
        using (StreamReader sr = new StreamReader(getResponse.GetResponseStream()))
        {
            pageSource = sr.ReadToEnd();
            sourceResult = pageSource;
        }
        return sourceResult;
    }

之后,您可以将其拆分为您想要离开的部分。

char[] trimChars = new char[] { ' ', ':', '/', '\\', '.' };
string[] split = sourceResult.Split(trimChars, StringSplitOptions.RemoveEmptyEntries);

答案 1 :(得分:0)

以下是您可以遵循的步骤 -

  1. 获取页面网址的HttpWebResponse
  2. 阅读流中的响应
  3. 使用此流填充StreamReader
  4. 将此StreamReader中的整个页面内容读取到StringBuilder
  5. 使用正则表达式模式从stingbuilder上方查找文件路径,或者如果该文件路径在属性中,则从stringbuilder获取该属性的索引,然后检索文件路径。一旦获得第一个文件路径,然后子串剩余的字符串并按照相同的索引方式获得下一个。
  6. 希望这会对你有所帮助。