检索文件中的信息

时间:2017-06-04 10:27:21

标签: windows image file dataset mediametadataretriever

早上好。我从官方网站下载了Yahoo Flickr Creative Commons 100M(14G)数据集。当我提取它时,我得到了48 GB的文件,没有扩展名。我还有一个文件.txt,它解释了数据集的组成方式,并说它是由大量记录组成的:对于任何图像都注册了一些信息,如下载链接,照片/视频标识符,照片/视频哈希,用户昵称,日期和其他字段。 现在,我只需要图像和相关的哈希,所以问题是:我如何得到它?我有点不知道。谢谢大家的帮助

  

块引用

编辑:我已经设法用Word打开文件,但不是全部因为太大而且我有超过10000条这样的记录,例如:

0 6985418911 4e2f7a26a1dfbf165a7e30bdabf7e72a 39089491 @ N00 nino63004 2012-02-16 09:56:37.0 1331840483佳能+ PowerShot + ELPH + 310 + HS IMG_0520佳能,佳能+ powershot + hs + 310,嘉年华+ escatay,邮轮,elph,hs + 310,key + west + florida,powershot -81.804885 24.550558 12(链接到flickr,我无法发布)(其他链接)署名 - 非商业性使用 - 否许可证(其它链接)7205 8 df7747990d 692d7e0a7f jpg 0

  

块引用

0 个答案:

没有答案