Question

我有一个包含20000条记录的数据库。我希望我的代码可以计算哪些记录共享其标题中的第一个单词＆＃39;值。到目前为止，这是我的代码，并且它返回了1000条记录（我不认为有1000个单词可以作为记录的第一个单词共享，每个记录大约为20个）

我需要做些什么来计算第一个单词作为第一个单词共享的次数？（如记录1：标题：＆＃39;鲍勃乔去等等。记录2：标题：＆＃39;鲍勃反击＆＃39; 记录3：标题：＆＃39;乔和鲍勃回家＆＃39;

它会以“Bob＆＃39;有2个计数，而不是3个，因为Joe是记录3中的第一个单词

SELECT SUBSTR(TITLE, 1, INSTR(TITLE, ' ') -1) WORD
     , COUNT(SUBSTR(TITLE, 1, INSTR(TITLE, ' ') -1)) NUM 
  FROM FILM 
 GROUP BY SUBSTR(TITLE, 1, INSTR(TITLE, ' ') -1);

Answer 1

REGEXP_SUBSTR有点清洁。如果我理解你的要求，就应该这样做：

SELECT REGEXP_SUBSTR(TITLE, '\w+') first_word, COUNT(*) 
  FROM film
 GROUP BY REGEXP_SUBSTR(TITLE, '\w+');

计算单词在oracle中的列中出现的次数

1 个答案: