我打算做一个情绪分析项目,网站前端使用它。它旨在分析Twitter帖子。分析的文件将被放入数据库中。
我要按照数据库中的搜索字词对检索到的帖子进行分组。
为了使数据库操作更快,我不想比较字符串中的搜索词,想法是将搜索词转换为数字并使用它们来查找数据库中的条目。
我想到的用数字转换字符串的函数如下:
这样,对于30长度的字符串,我需要10个整数。
所以2个问题: 1-如果没有任何碰撞,是否有更好的功能将30长度的字符串转换为数字?
2-如果没有这种情况,在拥有一百万个搜索字词的数据库中,每个项目比较10个整数或者每个项目比较30个长度字符串会更好吗? 像
这样的东西Select from terms where i1 == search.i1 and i2 = search.i2 and ... i10 == search.i10
OR
Select from terms where term like search.term
感谢您的关注。