将字节转换为stings并消除twitter数据中的十六进制

时间:2017-02-04 17:55:39

标签: python twitter encoding utf bytestring

我需要从已经从Python3中的字节转换的字符串中删除十六进制。

我可以从字节转换为字符串,但后来我无法找到编码十六进制的方法或自动删除它们。我尝试编码为ASCII,但它不起作用。

我的文本数据在词典列表中的键“tweet_text”下面的值。 这是我的代码:

    for d in sheet_data:
        just_text = d['tweet_text']
        print('This is "just_text" type: ', type(just_text))
        just_text_strings = str(just_text)
        print('This is "just_text_strings" type: ', type(just_text_strings))
        just_text_clean = just_text_strings.encode('ascii', errors='ignore')

这是我的输出:

This is "just_text" type:  <class 'bytes'>
This is "just_text_strings" type:  <class 'str'>
b'b"[/Very seldom~ will someone enter your life] and you won\'t have to question\\xc3\\xa2\\xe2\\x82\\xac\\xc2\\xa6 "'

我感谢任何建议或想法来解决这个问题....这是Twitter数据,如果有帮助

1 个答案:

答案 0 :(得分:0)

问题不是字符串编码,而是终端编码类型。我在Windows终端中运行了这个命令:

public function updateProduct($data){
        $this->db->update('storelte_articulos',$data);
        $this->db->where('id');
    }

只需在终端输入。得到了这个输出:

chcp 65001

然后角色显示正常。

我无法删除角色,就像我想要的那样,但至少在&#39; b&#39;在字符串和十六进制消失之前。