Gsutil下载Android评论统计csv文件为二进制文件

时间:2015-01-18 18:55:31

标签: android google-play gsutil

我正在尝试下载Android应用的评论数据。

但gsutil下载的文件不是文本文件!

FWIW,我正在使用gsutil 4.7运行Ubuntu 14.04。

以下是一个例子

stats$ gsutil cat gs://pubsite_prod_rev_xxxxxxxxx/stats/ratings/ratings_com.yyyyyyyyyy_201501_overview.csv
��
�@��uO�X���]]GD/ �FP_G�%�fם���9;:��
                                            �� �5�����sv���g�T��S;�����v�jZ}�={H0B�y�cD~M�O���wC���2F����ZI��9�.p�wM�e��p�3���Rj#^�,�²Ԍ��bY�V`�jy���^�X-�p�2��b�&jg8�+�uV�|�~�N߰����xY:}��_��t�F[�,�������F���xY:}�aY�e���|U:

4 个答案:

答案 0 :(得分:1)

我刚刚第一次运行gsutil并看到了同样的东西 - 看起来像二进制垃圾。除了...

$ gsutil cp gs://pubsite_prod_rev_xxxx/reviews/reviews_com.yyyy.csv .
$ file reviews_com.yyyy.csv
$ reviews_com.yyyy.csv: Little-endian UTF-16 Unicode text, with very long lines

所以它是文本,你只需要使用正确的工具来查看它。我设法把它加载到gedit:

$ gedit reviews_com.yyyy.csv

然后保存为其他内容。我相信有更好的方法。

答案 1 :(得分:0)

您的存储桶中的数据似乎是加密的或其他格式。我试图在相同的环境中下载文件,它对我很有用。因此,我建议您检查文件内容,只需从存储桶中手动下载即可。

答案 2 :(得分:0)

我刚为我们的应用程序下载了三个.csv审核文件,并注意到了相同的内容。我正在运行Mac OS X(yosemite / 10.10.1),对我来说,该文件被识别为gzipped文件:

$ file Dec2014.csv
$ Dec2014.csv: gzip compressed data, from FAT filesystem (MS-DOS, OS/2, NT)

我设法通过将.zip添加到文件名末尾并解压缩来将其转换为可读文件。然后它是一个非常好的文本文件,例如,TextEdit或Numbers。

答案 3 :(得分:0)

可能是utf-16编码的。你可以运行它来在Mac上进行转换:

iconv -f UTF-16 <file>.csv
不幸的是,谷歌的评论要比苹果公司的RSS提要要复杂得多......