所以我们假设我们有一个这样的字符串:
‰û]M§Äq¸ºþe Ø·¦ŸßÛµÖ˜eÆÈym™ÎB+KºªXv©+Å+óS—¶ê'å‚4ŒBFJF󒉚Ү}Fó†ŽxöÒ&‹¢ T†^¤( OêIº ò|<)ð
如何将其转换为人类可读的字符串,因为它是来自网络服务器的HTML输出,这是我认为正确加载网页的一半文本。我是否需要像C或Python之类的东西一样阅读它。那只是字符串的片段。
答案 0 :(得分:1)
如果事实上假设是一个人类可读的字符串,你需要弄清楚它使用和翻译的character encoding。字符串也可能被压缩,加密或表示二进制数据。知道从哪里获取字符串会很有帮助。
答案 1 :(得分:0)
我猜你的网络服务器没有发送正确的mime类型。我建议使用Firefox的Live Headers插件查看http标头。如果Web服务器决定向您发送pdf,但未设置mime类型,则只会在屏幕上看到垃圾。或者,将页面保存到文件,然后从Cygwin或unix shell运行这些命令:
file mypage.htm
strings mypage.htm
第一个将告诉您标头字节是否遵循任何可识别的模式。第二个将删除并显示所有人类可读的文本。