标签: php sql classification linguistics
英文单词检测字符串+分类 我有一个庞大的网址数据库,我想从这些数据中提取英文单词,然后对网址中包含的单词进行分类
例如apple.com - >苹果:水果和应用程序:电脑
我还有其他PHP脚本每个字符串的单词,但我需要帮助的是一个用于分类的英文单词的开放数据源
例如忍者=武术
PHP部分他们只是进行查找。 我已经看过用于对页面内容进行分类的贝叶斯脚本,但这更多的是关于几个单词......它可能比需要的更复杂。
提前干杯,
答案 0 :(得分:0)
你应该看看Wordnet。这是一种词汇资源,通过将单词与其同义词集合(synset)进行分组来对单词进行分类。它应该可以帮助您获得有意义的分类。