我在php中找到了 preg_split 和爆炸函数,用于将空格分隔的字符串分解为单词。它也很有用。但我想要工作的下一步是删除重复的单词和[“,”,“。”还有很少的其他标点符号......
如果是 “我爱尼泊尔。尼泊尔是一个内陆国家。尼泊尔在亚洲。”
我想在序言中只得到一个独特的词语:
我,爱,尼泊尔,是,内陆,国家,在亚洲
答案 0 :(得分:1)
答案 1 :(得分:0)
这应该就是完成工作:
$string = "I love nepal. Nepal is a landlocked country. Nepal is in Asia.";
$string = preg_replace( "/[^\w\s]/", "", $string );
$words = array();
foreach ( explode( " ", $string ) AS $word ) {
$word = strtolower($word);
$words[$word] = 1;
}
$unique_words = array_keys( $words );