我有一个ASCII数据集,它具有ctrl A字段分隔符和\ n作为行分隔符。我希望将其读入Python并且想知道如何处理它。特别是我希望能够将这些信息读入熊猫数据帧。
我目前有;
import pandas as pd
input = pd.read_csv('000000_0', sep='^A')
我得到的错误是
_main__:1: ParserWarning: Falling back to the 'python' engine because the 'c' engine does
not support regex separators; you can avoid this warning by specifying engine='python'.
然后我不知道我是如何指定行分隔符的。
有什么想法吗?
提前致谢!
答案 0 :(得分:3)
将pd.read_csv
与参数<a>
sep=chr(1)
答案 1 :(得分:3)
不是提及“ ^ A”,而是提及十六进制代码。它的工作就像一种魅力
import pandas as pd
data = pd.read_csv('000000_0', sep='\x01')
答案 2 :(得分:0)
Python的csv库非常适合读取分隔文件; - )
以上面链接的文档为例:
import csv
with open('eggs.csv', 'rb') as csvfile:
spamreader = csv.reader(csvfile, delimiter=' ', quotechar='|')
for row in spamreader:
print ', '.join(row)
这将自动遍历文件中的行(从而处理换行符),您可以如图所示设置分隔符。
答案 3 :(得分:0)
如果CTRL+A
表示SOH
的ASCII代码(标题的开头),请先尝试在换行符上拆分数据以获取行,然后将这些行拆分为"\x01"
,这是SOH
的十六进制代码。但是没有任何代码,数据,预期结果或错误消息,这主要是猜测。
答案 4 :(得分:0)
尝试一下
2:5 error Expected catch() or return promise/catch-or-return
2:49 warning Unexpected function expression prefer-arrow-callback
2:49 error Each then() should return a value or throw promise/always-return
3:31 warning Unexpected function expression prefer-arrow-callback