C的XML解析器

时间:2008-12-30 07:15:27

标签: c xml parsing

你能为C推荐一些最好的XML Parser吗?

10 个答案:

答案 0 :(得分:65)

expatlibxml2的两个示例。第二个是, 恕我直言,更容易使用,因为它在内存中创建一个树,一个数据 结构易于使用。另一方面,外籍人士也这样做 不构建任何东西(你必须自己做),它只是允许你 在解析期间在特定事件中调用处理程序。但外籍人士可能会 更快(我没有测量)。

使用expat,读取XML文件并显示缩进的元素:

/* 
   A simple test program to parse XML documents with expat
   <http://expat.sourceforge.net/>. It just displays the element
   names.

   On Debian, compile with:

   gcc -Wall -o expat-test -lexpat expat-test.c  

   Inspired from <http://www.xml.com/pub/a/1999/09/expat/index.html> 
*/

#include <expat.h>
#include <stdio.h>
#include <string.h>

/* Keep track of the current level in the XML tree */
int             Depth;

#define MAXCHARS 1000000

void
start(void *data, const char *el, const char **attr)
{
    int             i;

    for (i = 0; i < Depth; i++)
        printf("  ");

    printf("%s", el);

    for (i = 0; attr[i]; i += 2) {
        printf(" %s='%s'", attr[i], attr[i + 1]);
    }

    printf("\n");
    Depth++;
}               /* End of start handler */

void
end(void *data, const char *el)
{
    Depth--;
}               /* End of end handler */

int
main(int argc, char **argv)
{

    char           *filename;
    FILE           *f;
    size_t          size;
    char           *xmltext;
    XML_Parser      parser;

    if (argc != 2) {
        fprintf(stderr, "Usage: %s filename\n", argv[0]);
        return (1);
    }
    filename = argv[1];
    parser = XML_ParserCreate(NULL);
    if (parser == NULL) {
        fprintf(stderr, "Parser not created\n");
        return (1);
    }
    /* Tell expat to use functions start() and end() each times it encounters
     * the start or end of an element. */
    XML_SetElementHandler(parser, start, end);
    f = fopen(filename, "r");
    xmltext = malloc(MAXCHARS);
    /* Slurp the XML file in the buffer xmltext */
    size = fread(xmltext, sizeof(char), MAXCHARS, f);
    if (XML_Parse(parser, xmltext, strlen(xmltext), XML_TRUE) ==
        XML_STATUS_ERROR) {
        fprintf(stderr,
            "Cannot parse %s, file may be too large or not well-formed XML\n",
            filename);
        return (1);
    }
    fclose(f);
    XML_ParserFree(parser);
    fprintf(stdout, "Successfully parsed %i characters in file %s\n", size,
        filename);
    return (0);
}

使用libxml2,一个显示根元素名称的程序 和孩子的名字:

/*
   Simple test with libxml2 <http://xmlsoft.org>. It displays the name
   of the root element and the names of all its children (not
   descendents, just children).

   On Debian, compiles with:
   gcc -Wall -o read-xml2 $(xml2-config --cflags) $(xml2-config --libs) \
                    read-xml2.c    

*/

#include <stdio.h>
#include <string.h>
#include <libxml/parser.h>

int
main(int argc, char **argv)
{
    xmlDoc         *document;
    xmlNode        *root, *first_child, *node;
    char           *filename;

    if (argc < 2) {
        fprintf(stderr, "Usage: %s filename.xml\n", argv[0]);
        return 1;
    }
    filename = argv[1];

    document = xmlReadFile(filename, NULL, 0);
    root = xmlDocGetRootElement(document);
    fprintf(stdout, "Root is <%s> (%i)\n", root->name, root->type);
    first_child = root->children;
    for (node = first_child; node; node = node->next) {
        fprintf(stdout, "\t Child is <%s> (%i)\n", node->name, node->type);
    }
    fprintf(stdout, "...\n");
    return 0;
}

答案 1 :(得分:39)

pure assembler编写的文章如何:-)不要忘记查看benchmarks

答案 2 :(得分:36)

最广泛使用的两种解析器是Expatlibxml

如果你可以使用C ++,那么Xerces-C++也是如此。

答案 3 :(得分:9)

你可以尝试ezxml - 它是一个完全用C语言编写的轻量级解析器。

对于C ++,您可以查看TinyXML++

答案 4 :(得分:6)

http://www.minixml.org也很不错。小而且只是ANSI C。

答案 5 :(得分:4)

我个人的偏好是libxml2。它非常容易使用,但我从不打扰它进行基准测试,因为我只使用它进行配置文件解析。

答案 6 :(得分:2)

Expat非常体面。如果没有更多信息,很难提出好的建议。

答案 7 :(得分:2)

您能否说明您正在撰写哪些平台?这应该在很大程度上权衡“最佳”。你可能会发现一个超级'xml-foo'库,默认情况下在大多数系统上都不常见。虽然它很棒,缺少库可能会阻止(或至少)惹恼用户。

大多数情况下,我使用libxml2 ..因为它的标准或易于在我定位的平台上安装。

如您所见,“最佳”也取决于目标平台上可用的库。

答案 8 :(得分:2)

对于C ++,我建议使用CMarkup

答案 9 :(得分:0)

在Windows上,它是原生的Win32 api ...