标签: web-crawler common-crawl
我正试图从网页上收集所有可用的乌兹别克语文本信息(以供我研究)。最好的方法是什么?。
我发现了“常见爬网”,但不确定提取特定语言的文字是否容易。