在perl中识别单词

时间:2018-10-11 21:43:56

标签: arrays string perl

我正在尝试浏览一个文件列表,这些文件中包含单词的单词一起打散,并将单词分开。

my @file_list = (
    'myfirstperlfile.pl',
    'mashpotatorecipes.pl',
    'badhaircuts.pl',
    'jonisntverygoodatsoftball.pl',
    'thatnewcomedianislol.pl',
);

我的列表可以用任何东西描绘,但是出于示例的目的,它看起来可能像这样。

my @delineated_file_list = (
    'my first perl file',
    'mash potato recipes',
    'bad haircuts',
    'jon isnt very good at soft ball',
    'that new comedian is lol',
);        

在我的特定情况下,有很多文件,因此查找静态单词不是理想的选择。

让perl最好知道我的,first,perl和文件是分开的单词吗?我还担心识别缩写,拼写错误或虚假的单词。

1 个答案:

答案 0 :(得分:2)

如果不开发AI,您不太可能找到完美的解决方案。但是首先,您需要一个知道英文单词的模块,因此请查看Lingua::EN名称空间。 Lingua::EN::Segment看起来与您的用例相似。