Question

我正在尝试使用Chrome扩展程序历史记录API根据输入的搜索字词获取用户的历史记录。但在某些情况下搜索无法正常工作。例如，当我输入术语“bi”时，没有给出结果但是当我搜索“bit”时给出了一些但不是全部的结果，我通过在chrome历史搜索中验证它来检查它并且它显示了更多结果。这是历史API如何工作或我做错了什么？这是我的代码 -

window.onload = function() {

function getHistory() {
  var list = document.getElementById('list');
  var box = document.getElementById("box").value;
  if (box === '') {
    list.innerHTML = '';
    list.innerHTML = list.innerHTML + 'Nothing To Search.';
  }
  else {
    var microseconds = 1000 * 60 * 60 * 24 * 365 * 45;
    var start = (new Date).getTime() - microseconds;
  chrome.history.search({text: box, startTime: 0, maxResults: 50000}, function(data) {
    if(Object.keys(data).length === 0) {
    list.innerHTML = '';
      list.innerHTML = list.innerHTML + 'Nothing Found.';
    }
    else {
      list.innerHTML = '';
        data.forEach(function(page) {
        list.innerHTML = list.innerHTML + '<li><p>'+page.title+'</p> <a href='+page.url+' target="_blank"><p>'+page.url+'</p></a></li> <hr>';
    });
   }
  });
 }
}

document.getElementById('search').onclick = getHistory;
}

谢谢。

Answer 1

我看到与我正在撰写的扩展程序相同的行为。这真的很烦人，所以我开始挖掘Chromium源代码，找出它与历史结果相匹配的真正含义。

简答： 从源代码看来，这种行为是有意的，所以如果我们想要检索文本查询的所有匹配项，我们就会在检索所有历史记录结果并在JavaScript中搜索匹配项时遇到困难。另外，请不要忘记仔细检查开始/结束时间，并确保您的“最终结果”排除在外。属性足够大，因为任何这些属性的错误值都可能会给您带来意想不到的结果。

答案很长

免责声明：我没有太多的C ++经验，所以如果错误，请更正我的评估。

在使用非空文本查询调用chrome.history.search之后，最终会调用以下函数（在history_backend.cc中）。

    bool URLDatabase::GetTextMatchesWithAlgorithm(
    const base::string16& query,
    query_parser::MatchingAlgorithm algorithm,
    URLRows* results) {
  query_parser::QueryNodeVector query_nodes;
  query_parser_.ParseQueryNodes(query, algorithm, &query_nodes);

  results->clear();
  sql::Statement statement(GetDB().GetCachedStatement(SQL_FROM_HERE,
      "SELECT" HISTORY_URL_ROW_FIELDS "FROM urls WHERE hidden = 0"));

  while (statement.Step()) {
    query_parser::QueryWordVector query_words;
    base::string16 url = base::i18n::ToLower(statement.ColumnString16(1));
    query_parser_.ExtractQueryWords(url, &query_words);
    GURL gurl(url);
    if (gurl.is_valid()) {
      // Decode punycode to match IDN.
      base::string16 ascii = base::ASCIIToUTF16(gurl.host());
      base::string16 utf = url_formatter::IDNToUnicode(gurl.host());
      if (ascii != utf)
        query_parser_.ExtractQueryWords(utf, &query_words);
    }
    base::string16 title = base::i18n::ToLower(statement.ColumnString16(2));
    query_parser_.ExtractQueryWords(title, &query_words);

    if (query_parser_.DoesQueryMatch(query_words, query_nodes)) {
      URLResult info;
      FillURLRow(statement, &info);
      if (info.url().is_valid())
        results->push_back(info);
    }
  }
  return !results->empty();
}

传递给此函数的算法query_parser::MatchingAlgorithm引用下面显示的枚举（来自query_parser.h），并且从未根据我的判断明确设置，因此它将是DEFAULT值。

enum class MatchingAlgorithm {
  // Only words long enough are considered for prefix search. Shorter words are
  // considered for exact matches.
  DEFAULT,
  // All words are considered for a prefix search.
  ALWAYS_PREFIX_SEARCH,
};

阅读DEFAULT选项上方的评论 -

＆＃34;只有足够长的单词被认为是前缀搜索。短单词被认为是完全匹配＆＃34;

算法本身（query_parser.cc）将您的文本查询和原始URL结果分解为＆＃34;单词＆＃34;用空格或标点符号分隔，并检查前缀匹配＆＃39;每对之间。这就解释了为什么如果您的历史记录中包含多个文本＆＃34; chromium＆＃34;在网址中，如果您搜索＆＃34; hromium＆＃34;，则不会获得任何结果，但如果您搜索＆＃34; chro＆＃34;，您将获得所有结果。

在你的情况下，我认为搜索＆＃34; bi＆＃34;不会返回任何结果，因为该算法仅针对短项查找精确词匹配，这意味着＆＃34; bi＆＃34;需要在URL /标题中用空格或标点符号包围。如果您执行Google搜索＆＃34; bi＆＃34;，然后再次查询＆＃34; bi＆＃34;，则会确认这一点。谷歌搜索历史项目将匹配，因为在谷歌搜索的URL中，＆＃34; bi＆＃34;被标点符号和空格所包围：

https://www.google.ca/webhp?sourceid=chrome-instant&ion=1&espv=2&ie=UTF-8#q=的双

<强>来源

Chromium source code that is searchable

history_types.h - enum for algorithm

query_parser.cc - algorithm itself

history_service.cc - called from Javascript

history_backend.cc - called from history service

Answer 2

chrome.history.search并不一定意味着将检索所有网页。文档说明它将搜索与查询匹配的每个页面的上次访问时间。这可能是它看起来不完整的原因。

至于为什么当有2个字符时没有结果，而当有3个字符时会返回一些结果，我无法确定。这可能是由于设置了其他参数，例如startTime。它应该有一个纪元时间值，并将其设置为0将尝试搜索自1970年以来（这可能是您打算做的）。

Chrome扩展程序历史记录API未显示所有结果？

2 个答案: