你能为C推荐一些最好的XML Parser吗?
答案 0 :(得分:65)
expat和libxml2的两个示例。第二个是, 恕我直言,更容易使用,因为它在内存中创建一个树,一个数据 结构易于使用。另一方面,外籍人士也这样做 不构建任何东西(你必须自己做),它只是允许你 在解析期间在特定事件中调用处理程序。但外籍人士可能会 更快(我没有测量)。
使用expat,读取XML文件并显示缩进的元素:
/*
A simple test program to parse XML documents with expat
<http://expat.sourceforge.net/>. It just displays the element
names.
On Debian, compile with:
gcc -Wall -o expat-test -lexpat expat-test.c
Inspired from <http://www.xml.com/pub/a/1999/09/expat/index.html>
*/
#include <expat.h>
#include <stdio.h>
#include <string.h>
/* Keep track of the current level in the XML tree */
int Depth;
#define MAXCHARS 1000000
void
start(void *data, const char *el, const char **attr)
{
int i;
for (i = 0; i < Depth; i++)
printf(" ");
printf("%s", el);
for (i = 0; attr[i]; i += 2) {
printf(" %s='%s'", attr[i], attr[i + 1]);
}
printf("\n");
Depth++;
} /* End of start handler */
void
end(void *data, const char *el)
{
Depth--;
} /* End of end handler */
int
main(int argc, char **argv)
{
char *filename;
FILE *f;
size_t size;
char *xmltext;
XML_Parser parser;
if (argc != 2) {
fprintf(stderr, "Usage: %s filename\n", argv[0]);
return (1);
}
filename = argv[1];
parser = XML_ParserCreate(NULL);
if (parser == NULL) {
fprintf(stderr, "Parser not created\n");
return (1);
}
/* Tell expat to use functions start() and end() each times it encounters
* the start or end of an element. */
XML_SetElementHandler(parser, start, end);
f = fopen(filename, "r");
xmltext = malloc(MAXCHARS);
/* Slurp the XML file in the buffer xmltext */
size = fread(xmltext, sizeof(char), MAXCHARS, f);
if (XML_Parse(parser, xmltext, strlen(xmltext), XML_TRUE) ==
XML_STATUS_ERROR) {
fprintf(stderr,
"Cannot parse %s, file may be too large or not well-formed XML\n",
filename);
return (1);
}
fclose(f);
XML_ParserFree(parser);
fprintf(stdout, "Successfully parsed %i characters in file %s\n", size,
filename);
return (0);
}
使用libxml2,一个显示根元素名称的程序 和孩子的名字:
/*
Simple test with libxml2 <http://xmlsoft.org>. It displays the name
of the root element and the names of all its children (not
descendents, just children).
On Debian, compiles with:
gcc -Wall -o read-xml2 $(xml2-config --cflags) $(xml2-config --libs) \
read-xml2.c
*/
#include <stdio.h>
#include <string.h>
#include <libxml/parser.h>
int
main(int argc, char **argv)
{
xmlDoc *document;
xmlNode *root, *first_child, *node;
char *filename;
if (argc < 2) {
fprintf(stderr, "Usage: %s filename.xml\n", argv[0]);
return 1;
}
filename = argv[1];
document = xmlReadFile(filename, NULL, 0);
root = xmlDocGetRootElement(document);
fprintf(stdout, "Root is <%s> (%i)\n", root->name, root->type);
first_child = root->children;
for (node = first_child; node; node = node->next) {
fprintf(stdout, "\t Child is <%s> (%i)\n", node->name, node->type);
}
fprintf(stdout, "...\n");
return 0;
}
答案 1 :(得分:39)
用pure assembler编写的文章如何:-)不要忘记查看benchmarks。
答案 2 :(得分:36)
如果你可以使用C ++,那么Xerces-C++也是如此。
答案 3 :(得分:9)
答案 4 :(得分:6)
http://www.minixml.org也很不错。小而且只是ANSI C。
答案 5 :(得分:4)
我个人的偏好是libxml2。它非常容易使用,但我从不打扰它进行基准测试,因为我只使用它进行配置文件解析。
答案 6 :(得分:2)
Expat非常体面。如果没有更多信息,很难提出好的建议。
答案 7 :(得分:2)
您能否说明您正在撰写哪些平台?这应该在很大程度上权衡“最佳”。你可能会发现一个超级'xml-foo'库,默认情况下在大多数系统上都不常见。虽然它很棒,缺少库可能会阻止(或至少)惹恼用户。
大多数情况下,我使用libxml2 ..因为它的标准或易于在我定位的平台上安装。
如您所见,“最佳”也取决于目标平台上可用的库。
答案 8 :(得分:2)
对于C ++,我建议使用CMarkup。
答案 9 :(得分:0)
在Windows上,它是原生的Win32 api ...