Glib :: Regex选择了TextTag-s

时间:2012-08-17 14:01:10

标签: c++ regex gtk glib

我正在使用Gtk :: TextBuffer-s试验Glib :: Regex和Gtk :: TextView,我正在尝试用Gtk :: TextTag-s进行语法高亮。


void MainWindow::update_syntax(const Gtk::TextBuffer::iterator& start, const Gtk::TextBuffer::iterator& end)    {
  std::vector<Glib::ustring> keywords;
  Glib::MatchInfo info;
  auto regex = Glib::Regex::create(R"((\w+))");
  auto ok = regex->match(start.get_visible_text(end), info);
  std::map<Glib::ustring, std::pair<Glib::RefPtr<Gtk::TextMark>, Glib::RefPtr<Gtk::TextMark>>> marks;
  do {
    std::cout << "word: " << info.fetch(1) << std::endl;
    for (auto kw : keywords) {
      if (info.fetch(1) == kw) {
        int start_offset, end_offset;
        info.fetch_pos(1, start_offset, end_offset);
        std::cout << info.fetch(1) << " (at: [" << start_offset << ";" << end_offset << "])" << std::endl;
        marks["keyword"] = std::make_pair(
            this->m_buffer->get_iter_at_offset(start.get_offset() + start_offset)
            this->m_buffer->get_iter_at_offset(start.get_offset() + end_offset)
  } while(;

  for (auto mark : marks) {
      mark.second.first->get_iter(), mark.second.second->get_iter());

所以流程是我创建一个简单的正则表达式,它应匹配该行中的每个单词,然后创建一个标记映射,稍后将给出将设置标记的范围。我在这里使用Gtk :: Mark,因为每次修改缓冲区都会使迭代器失效。


void MainWindow::on_insert(const Gtk::TextBuffer::iterator& pos,
  const Glib::ustring& text, int bytes)
  std::cout << text << " (added at[" << pos.get_offset() <<
  "]; with [" << bytes << "]bytes)" << std::endl << std::endl;

因此,将class class写入TextView的输出会导致第一个突出显示,而第二个未被拾取,记录:

c (added at[1]; with [1]bytes)

word: c
l (added at[2]; with [1]bytes)

word: cl
a (added at[3]; with [1]bytes)

word: cla
s (added at[4]; with [1]bytes)

word: clas
s (added at[5]; with [1]bytes)

word: class
class (keyword at: [0;5])
  (added at[6]; with [1]bytes)

word: class
class (keyword at: [0;5])
word: r
c (added at[7]; with [1]bytes)

word: class
class (keyword at: [0;5])
word: rd
l (added at[8]; with [1]bytes)

word: class
class (keyword at: [0;5])
word: rd
a (added at[9]; with [1]bytes)

word: class
class (keyword at: [0;5])
word: rd
word: a
s (added at[10]; with [1]bytes)

word: class
class (keyword at: [0;5])
word: rd
word: as
s (added at[11]; with [1]bytes)

word: class
class (keyword at: [0;5])
word: rd
word: ass

很容易注意到最后一行显示它被两个偏移移动了。可能是应用了标签。此外,这里还不清楚:word: rd。我使用keyword作为标记的名称。当这段代码仍在使用迭代器时,info.fetch(1)返回"keyword",那么正则表达式也匹配标签吗?


1 个答案:

答案 0 :(得分:2)

我还没有使用过这个特定的API 1 ,但我认为你的对象生命周期存在问题。 iter->get_visible_text()返回一个字符串对象,该对象在调用regex->match()后被销毁。这是一个问题,因为Glib::MatchInfo::next()期望字符串仍然存在 2 。这可能是你为第二场比赛得到垃圾的原因。我认为你做这样的事情是安全的:

auto visbuf = start.get_visible_text(end); 
auto ok = regex->match(visbuf, info);  // existing line
  1. 所以我可能充满了废话。
  2. 来自Glib :: MatchInfo :: next()文档:匹配是在传递给匹配函数的字符串上完成的,因此在调用此函数之前无法释放它。