Question

我需要使用C.

将HTML解析为.txt格式

一个例子 - 它必须检测每个

1. <p>
2. <tr>
3. <ul> etc...

并将它们转换为文本（在文档中）

有人可以帮忙吗？

Answer 1

我认为，在html下载c网页的最简单方法是使用libcurl。假设您已经设置了开发环境，请按照以下步骤操作：

访问libcurl的 download page 并下载其最新版本。
查看 install page 并了解如何安装库。对于Linux，安装非常简单，只需在终端中键入./configure && make && make install即可。
下载libcurl的{{3}}示例。此文件中公开的<curl/curl.h>头文件实际上提供了必要的功能，以便您与Web服务器进行通信。
接下来，使用url2file.c。

gcc -o url2file url2file.c -lcurl

注意：