嗨,
我正在尝试
分析网站(www.naver.com),找出图像和图像 文本。 -必须有合理的理由/证据
如果是文本,则使用哪种数据类型?
在找出什么元素是图像和什么是文本时。我想到一个想法,如果我更改字符编码,那么任何更改的内容都是文本。
但是,imgur链接中image2的右下部分即使看起来很像文本也不会改变。它不受字符编码设置的影响。为什么?
此外,任何其他建议都很好:)
我正在尝试的另一种方法是
我使用webzip抓取了该网站,所有以图片(png,jpg ..)下载的内容都是图片。
其他所有内容均为文本。