使用Boost.Spirit在C ++中解析SQL查询

时间:2012-09-27 18:36:36

标签: c++ sql parsing boost-spirit

我创建了一个数据库引擎,我可以在其中创建和修改表,并将它们添加到数据库中。为了解析SQL查询,我使用EBNF表单实现了Boost.Spirit库。我正确设置了解析器,并成功解析了每个规则。

我的问题是我现在不知道如何整合这两者。 Boost.Spirit解析器只验证输入是否正确,但我需要它来实际某事。我查找了语义操作,但它们似乎没有处理我正在寻找的内容。

例如,如果我有一个查询,例如:
new_table <- SELECT (id < 5) old_table;

我希望它使用规则验证输入,然后调用函数
Table Database::Select(Table t , Condition c){ ... }
并将标记作为参数传递。

如何整合解析器?

1 个答案:

答案 0 :(得分:15)

  

注意:我选择在这里发明一个示例语法用于演示目的,因为您的问题没有显示出来。使用此处推荐的方法,在解析后编写函数来执行查询应该不难。

我真的建议建一个解析树。

我建议优先考虑属性传播,而不是语义动作。参见例如

属性传播规则在Spirit中非常灵活。每个Parser的文档都正确记录了默认的公开属性类型

E.g。 - qi::char_会产生boost::optional<char>qi::double_ | qi::int_会产生boost::variant<double, int>

您可能希望在您自己的发明的AST数据类型中累积已解析的元素,例如:

struct SelectStatement
{
    std::vector<std::string> columns, fromtables; 
    std::string whereclause; // TODO model as a vector<WhereCondition> :) 

    friend std::ostream& operator<<(std::ostream& os, SelectStatement const& ss)
    {
        return os << "SELECT [" << ss.columns.size() << " columns] from [" << ss.fromtables.size() << " tables]\nWHERE " + ss.whereclause;
    }
};

您可以通过将结构调整为Fusion序列来使其适应Spirits属性传播机制:

BOOST_FUSION_ADAPT_STRUCT(SelectStatement, 
        (std::vector<std::string>, columns)
        (std::vector<std::string>, fromtables)
        (std::string, whereclause)
       )

现在您可以将以下规则解析为该类型:

sqlident = lexeme [ alpha >> *alnum ]; // table or column name

columns  = no_case [ "select" ] >> (sqlident % ',');
tables   = no_case [ "from" ]   >> (sqlident % ',');

start    = columns >> tables 
    >> no_case [ "where" ]
    >> lexeme [ +(char_ - ';') ]
    >> ';';

您可以在此处看到此 代码正常运行 http://liveworkspace.org/code/0b525234dbce22cbd8becd69f84065c1

完整的演示代码:

// #define BOOST_SPIRIT_DEBUG
#include <boost/fusion/adapted.hpp>
#include <boost/spirit/include/qi.hpp>

namespace qi    = boost::spirit::qi;

struct SelectStatement
{
    std::vector<std::string> columns, fromtables; 
    std::string whereclause; // TODO model as a vector<WhereCondition> :) 

    friend std::ostream& operator<<(std::ostream& os, SelectStatement const& ss)
    {
        return os << "SELECT [" << ss.columns.size() << " columns] from [" << ss.fromtables.size() << " tables]\nWHERE " + ss.whereclause;
    }
};

BOOST_FUSION_ADAPT_STRUCT(SelectStatement, 
        (std::vector<std::string>, columns)
        (std::vector<std::string>, fromtables)
        (std::string, whereclause)
       )

template <typename It, typename Skipper = qi::space_type>
    struct parser : qi::grammar<It, SelectStatement(), Skipper>
{
    parser() : parser::base_type(start)
    {
        using namespace qi;

        sqlident = lexeme [ alpha >> *alnum ]; // table or column name

        columns  = no_case [ "select" ] >> (sqlident % ',');
        tables   = no_case [ "from" ]   >> (sqlident % ',');

        start    = columns >> tables 
            >> no_case [ "where" ]
            >> lexeme [ +(char_ - ';') ]
            >> ';';

        BOOST_SPIRIT_DEBUG_NODE(start);
        BOOST_SPIRIT_DEBUG_NODE(sqlident);
        BOOST_SPIRIT_DEBUG_NODE(columns);
        BOOST_SPIRIT_DEBUG_NODE(tables);
    }

  private:
    qi::rule<It, std::string()             , Skipper> sqlident;
    qi::rule<It, std::vector<std::string>(), Skipper> columns  , tables;
    qi::rule<It, SelectStatement()         , Skipper> start;
};

template <typename C, typename Skipper>
    bool doParse(const C& input, const Skipper& skipper)
{
    auto f(std::begin(input)), l(std::end(input));

    parser<decltype(f), Skipper> p;
    SelectStatement query;

    try
    {
        bool ok = qi::phrase_parse(f,l,p,skipper,query);
        if (ok)   
        {
            std::cout << "parse success\n";
            std::cout << "query: " << query << "\n";
        }
        else      std::cerr << "parse failed: '" << std::string(f,l) << "'\n";

        if (f!=l) std::cerr << "trailing unparsed: '" << std::string(f,l) << "'\n";
        return ok;
    } catch(const qi::expectation_failure<decltype(f)>& e)
    {
        std::string frag(e.first, e.last);
        std::cerr << e.what() << "'" << frag << "'\n";
    }

    return false;
}

int main()
{
    const std::string input = "select id, name, price from books, authors where books.author_id = authors.id;";
    bool ok = doParse(input, qi::space);

    return ok? 0 : 255;
}

将打印输出:

parse success
query: SELECT [3 columns] from [2 tables]
WHERE books.author_id = authors.id