这个图像存储的是什么?

时间:2015-01-11 12:49:14

标签: html

我想从网站上提取这些电话号码,可以是图像,也可以是字符串。

以下是网站上的示例:Link

如您所见,电话号码是图像。

但是,当我打开图像源时,我似乎无法查看图像:

<img src="http://www.callmyname.sg/search/display_phone_number/VUhkVE1WOW5BV1lFWWxSbVhUdFRObGMzQlRBRU9nPT0=">

但是当放入html并在浏览器中查看时,您可以看到图像正常。

3 个答案:

答案 0 :(得分:1)

这是一个阻止像你这样的人抓住他们网站的解决方案:)

网址http://www.callmyname.sg/search/display_phone_number/VUhkVE1WOW5BV1lFWWxSbVhUdFRObGMzQlRBRU9nPT0=会生成一个生成图像的脚本 - 可能基于参数。

VUhkVE1WOW5BV1lFWWxSbVhUdFRObGMzQlRBRU9nPT0=

因为它以等号结束,我试图将其解码为base64:

UHdTMV9nAWYEYlRmXTtTNlc3BTAEOg==

现在看起来更像是base64,所以我尝试了另一轮:

PwS1_gfbTf];S6W70:

所以它显然不是明文(或不用base64编码),这将是荒谬的,并会让你以这种方式提取数字。他们要么使用一些特殊的密码,要么将数字存储在数据库中,并将其作为标识符。

我不认为你可以轻易窃取电话号码,也许只能使用OCR。


当您访问该URL时,您将获得垃圾,因为它们不会发送正确的MIME标头

�PNG  IHDR�,���tRNS���7X}4IDATx���_HZo�g�� E��p��l��EHTx!]�DtQ�M�.x3��.dx�*b]Dl"]�D���bQq.B����Z2$��:ȡ�wq��9�s���Cx>W�}���ٳ��ڶ����]���Ǐ�/_���ݿ���ahh���\q����������555�=���*�"�*�*�f�����}uu�e�d2���o����?00p����J%ȴds���BB�˲�`�`0RJy����n�{cc�e�H$b�ۻ����(�~�_����A4�Z��_�V|��J�w�����t:��333.��ƕ������+^����L`���֑��W��3�X�"    y���$p'U"��F���y���z&�ioo��萟�*� ����\�L&Sx����p�e���ׯ_R��y�J%�~����|qq��|e�Z%:�J�{��q��nW�ՉD"�J��~�n4��������̔Ty���qF���>BwGa�z����������8��ߡc�f��B�>!�Ub�N�s���|�F�^/B���Lj��i��NfJ��͛D"����� o!t��`����fvv�eم��V���D)�����x���d2966&�n� ^,0O4��(!D��l�h46�-�~��Tً>B�"�Q�>,�P��ok@U \�BU,�P���=G SA+GIEND�B`�

但它真的只是普通的PNG图像:

img http://www.callmyname.sg/search/display_phone_number/VUhkVU5scGlBV1lDWWdFelVEUUhZQWRvQlRZR013PT0=

答案 1 :(得分:0)

它实际上是一个png文件,由计算机在显示之前生成。您可以从任何其他页面引用它,并且您也应该能够轻松下载它(右键单击,另存为...)注意:我测试了这一点,请确保使用扩展名保存图像{ {1}}而不是.png,它将默认为。

&#13;
&#13;
.html
&#13;
&#13;
&#13;

答案 2 :(得分:0)

这是PNG图像,但服务器未指定正确的内容标头。它告诉你的浏览器不是UTF-8编码的html页面,所以你只看到一些垃圾(包括开头的字母PNG)。

<img>标签虽然不知道如何显示文字,但只是尝试将其加载为图像(并且成功)。

我没有看到以任何其他方式提取数字的方法,而不仅仅是阅读图像。因为它只包含数字并且始终具有相似的格式,所以您可以找到一种简单的方法来解析它而不是使用完整的OCR库。