SQL - 计算字频率

时间:2016-10-03 13:11:53

标签: mysql sql

我有一个包含多个列的数据库。其中一列包含一个段落,每行都有自己的段落。 在每个段落中都有单词,我想在所有列中计算双打。

示例:

What is your name ?

Hello, my name is Quentin

His name is Quentin

结果必须是:

 - Name - 3
 - is - 3
 - Quentin - 2

1 个答案:

答案 0 :(得分:0)

评论太长了。

我建议您创建一个包含"单词" (但是你定义了它们)每个段落。

你如何解析单词取决于你。一种方法是输出每行的id,然后使用python等工具将其转换为如下结构:

id    word    pos

然后您可以轻松使用此表来回答您的问题。