我正在尝试浏览一个文件列表,这些文件中包含单词的单词一起打散,并将单词分开。
my @file_list = (
'myfirstperlfile.pl',
'mashpotatorecipes.pl',
'badhaircuts.pl',
'jonisntverygoodatsoftball.pl',
'thatnewcomedianislol.pl',
);
我的列表可以用任何东西描绘,但是出于示例的目的,它看起来可能像这样。
my @delineated_file_list = (
'my first perl file',
'mash potato recipes',
'bad haircuts',
'jon isnt very good at soft ball',
'that new comedian is lol',
);
在我的特定情况下,有很多文件,因此查找静态单词不是理想的选择。
让perl最好知道我的,first,perl和文件是分开的单词吗?我还担心识别缩写,拼写错误或虚假的单词。
答案 0 :(得分:2)
如果不开发AI,您不太可能找到完美的解决方案。但是首先,您需要一个知道英文单词的模块,因此请查看Lingua::EN名称空间。 Lingua::EN::Segment看起来与您的用例相似。