标签: python web-scraping scrapy
是否有任何方法/包/框架可以从slidehare上的幻灯片中删除文本?我能想到的唯一方法是将幻灯片下载为pdf,然后运行OCR工具来提取文本。我想知道是否有更优雅的方式来做到这一点?理想情况下,我希望为多个演示文稿执行此操作,我正在寻找一种自动执行此过程的方法。
EDIT : Adding example
一个例子就是说这张幻灯片有很多元素。但是在评论之下,我们只能获得幻灯片的标题。我希望我们可以从这张幻灯片中删除整个文本。
https://developers.google.com/places/ios-api/autocomplete
This is what is shown below the comments