应用错误收集

在Python中获取Gutenberg短信的句子

时间：2016-02-12 03:50:37

标签： python regex text

我正在尝试解析100个Project Gutenberg文本以获取NLP任务，例如"H. G. Wells' War of the Worlds"。我正在尝试编写一个Python脚本来输出每个文本的句子列表。如何忽略Gutenberg文本的页眉和页脚以将实际书籍文本提取为句子？

0 个答案:

没有答案