提取HTML源代码linux库

时间:2014-02-02 02:43:27

标签: c++ html css

我正在使用Linux,我需要我的程序来提取HTML源代码并使用C ++语言将其放入一个字符串中,你能给我一个可以执行此操作的库吗?

1 个答案:

答案 0 :(得分:1)

easy solution是:

#include <string>
#include <iostream>
#include <stdio.h>

std::string execu(char* cmd) {
    FILE* pipe = popen(cmd, "r");
    if (!pipe) return "ERROR";
    char buffer[128];
    std::string result = "";
    while(!feof(pipe)) {
        if(fgets(buffer, 128, pipe) != NULL)
            result += buffer;
    }
    pclose(pipe);
    return result;
}
std::string result = execu("curl http://www.facebook.com");

但这不被认为是安全的,除非你知道传递的字符串不会打击任何东西。