我正在阅读csv,但是当我仔细查看列名时,第一列名称旁边有一个奇怪的符号,有人可以帮我摆脱这个符号吗?
现在列名称的外观(不确定'年份'旁边的符号是什么意思:
['year', 'sch', 'city', 'prop_id']
我希望列名看起来如何:
['year', 'sch', 'city', 'prop_id']
到目前为止我的代码:
import pandas as pd
path = ('file_path')
cameron_county = pd.read_table(path + '/2016_GCC_prelim_appraisal_info_20160630.txt',
encoding = 'latin1',error_bad_lines = False)
print(cameron_county.head(1))
print(cameron_county.columns)
提前谢谢你。
答案 0 :(得分:3)
这看起来像unciode BOM 尝试

请参阅:https://en.wikipedia.org/wiki/Byte_order_mark#Representations_of_byte_order_marks_by_encoding
EF BB BF
是utf-8 BOM十六进制代码的CP1252表示:StringBuilder
答案 1 :(得分:2)
导入后解决方案可能如下所示:
columns = pd.Index(['year', 'sch', 'city', 'prop_id'])
columns.str.replace(r'[^a-zA-Z0-9_-]', '')
Index([u'year', u'sch', u'city', u'prop_id'], dtype='object')