我使用流行的工具将一堆推文导出为CSV文件。但是,当我在TextWrangler(以及后来的Microsoft Excel)中打开导出的数据时,我看到它包含一些像这样的奇怪字符,洒在常规文本之间:
_Ÿ˜ç_Ÿ_¶
_Ÿ˜ƒ_Ÿ˜ƒ_Ÿ˜ƒ_Ÿ˜ƒ
知道这些是什么吗?我无法找到使用sed删除它们的方法。 (使用Mac)
答案 0 :(得分:0)
如上所述:
他们很可能是另一种语言的推文,使用不同的字符集。尝试更改编辑器中的编码选项,它们最终应该开始有意义。另请查看Twitter API,了解他们如何编码回复。