标签: sql oracle text duplicates documents
我需要以某种方式检测存储在我的表的BLOB字段中的重复文档(.doc,.pdf等)。
我一直在研究Oracle Text功能,但未能找到可以帮助我实现目标的东西。
事实上,我需要像UTL_MATCH这样的功能,但可能会对文件中的整个文档进行比较。
有人可以向我提供有关如何做到的任何提示吗?
编辑: 我没有搜索完全相同的副本,这可以通过文件比较来完成,我需要分析文档中的文本,这就是我尝试使用Oracle Text的原因。