我正在尝试下载Android应用的评论数据。
但gsutil下载的文件不是文本文件!
FWIW,我正在使用gsutil 4.7运行Ubuntu 14.04。
以下是一个例子
stats$ gsutil cat gs://pubsite_prod_rev_xxxxxxxxx/stats/ratings/ratings_com.yyyyyyyyyy_201501_overview.csv
��
�@��uO�X���]]GD/ �FP_G�%�fם���9;:��
�� �5�����sv���g�T��S;�����v�jZ}�={H0B�y�cD~M�O���wC���2F����ZI��9�.p�wM�e��p�3���Rj#^�,�²Ԍ��bY�V`�jy���^�X-�p�2��b�&jg8�+�uV�|�~�N߰����xY:}��_��t�F[�,�������F���xY:}�aY�e���|U:
答案 0 :(得分:1)
我刚刚第一次运行gsutil并看到了同样的东西 - 看起来像二进制垃圾。除了...
$ gsutil cp gs://pubsite_prod_rev_xxxx/reviews/reviews_com.yyyy.csv .
$ file reviews_com.yyyy.csv
$ reviews_com.yyyy.csv: Little-endian UTF-16 Unicode text, with very long lines
所以它是文本,你只需要使用正确的工具来查看它。我设法把它加载到gedit:
$ gedit reviews_com.yyyy.csv
然后保存为其他内容。我相信有更好的方法。
答案 1 :(得分:0)
您的存储桶中的数据似乎是加密的或其他格式。我试图在相同的环境中下载文件,它对我很有用。因此,我建议您检查文件内容,只需从存储桶中手动下载即可。
答案 2 :(得分:0)
我刚为我们的应用程序下载了三个.csv审核文件,并注意到了相同的内容。我正在运行Mac OS X(yosemite / 10.10.1),对我来说,该文件被识别为gzipped文件:
$ file Dec2014.csv
$ Dec2014.csv: gzip compressed data, from FAT filesystem (MS-DOS, OS/2, NT)
我设法通过将.zip添加到文件名末尾并解压缩来将其转换为可读文件。然后它是一个非常好的文本文件,例如,TextEdit或Numbers。
答案 3 :(得分:0)
可能是utf-16编码的。你可以运行它来在Mac上进行转换:
iconv -f UTF-16 <file>.csv
不幸的是,谷歌的评论要比苹果公司的RSS提要要复杂得多......