Question

所以我们假设我们有一个这样的字符串：

‰û]M§Äq¸ºþe Ø·¦ŸßÛµÖ˜eÆÈym™ÎB+KºªXv©+Å+óS—¶ê'å‚4ŒBFJFó’‰šÒ®}Fó†ŽxöÒ&‹¢ T†^¤( OêIº ò|<)ð

如何将其转换为人类可读的字符串，因为它是来自网络服务器的HTML输出，这是我认为正确加载网页的一半文本。我是否需要像C或Python之类的东西一样阅读它。那只是字符串的片段。

Answer 1

如果事实上假设是一个人类可读的字符串，你需要弄清楚它使用和翻译的character encoding。字符串也可能被压缩，加密或表示二进制数据。知道从哪里获取字符串会很有帮助。

Answer 2

我猜你的网络服务器没有发送正确的mime类型。我建议使用Firefox的Live Headers插件查看http标头。如果Web服务器决定向您发送pdf，但未设置mime类型，则只会在屏幕上看到垃圾。或者，将页面保存到文件，然后从Cygwin或unix shell运行这些命令：

file mypage.htm
strings mypage.htm

第一个将告诉您标头字节是否遵循任何可识别的模式。第二个将删除并显示所有人类可读的文本。