应用错误收集

从Web爬网程序搜索提取的数据的后续步骤

时间：2017-07-27 02:11:14

标签： python python-3.x web-scraping web-crawler text-mining

我刚刚拿起我的网络抓取工具/刮刀来取回我想要的文字，但现在我喜欢搜索这些线条，只带回一些特定字词的线条。

我想我需要拆分字符串？但这就是我迷失的地方。 Test_2从HTML页面中拉取正文。

这是我试图从Test_2中提取某些包含某些单词/短语的行：

import Test_2

def main():

    html_page = Test_2.string(text)
    date = "M-F"
    results = html_page.search(date)
    print(results)

main()

提前感谢您提出任何建议，指导或帮助！

0 个答案:

没有答案