t-sql计算文本列中的唯一单词

时间:2012-01-19 06:45:42

标签: sql-server tsql

我有一个包含图片标题的列。我想要做的是找到该列中最常用的单词。

有没有办法用t-sql做到这一点?

2 个答案:

答案 0 :(得分:3)

我认为这篇文章包含了你需要的所有内容Fast Text Processing in SQL Server 它包含SQL-Server 2000+和2005 +的解决方案。

答案 1 :(得分:0)

我认为你可以做这样的事情。我不认为这是最优化的,但你可以改进它。

创建一个表变量@t来存储单词 创建一个游标,遍历标题表中的每一行。 对于每一行,使用chunk split函数来获取一个表(http://www.sommarskog.se/arraylist-2005/tblnum-functions.html#chunk_split_me) 将表中的单词添加到表变量@t

在@t上做一个单词并计算(单词)和降序。