使用字段分隔符读取ASCII作为ctrl A并将行分隔为\ n进入python

时间:2017-02-22 09:57:41

标签: python pandas ascii

我有一个ASCII数据集,它具有ctrl A字段分隔符和\ n作为行分隔符。我希望将其读入Python并且想知道如何处理它。特别是我希望能够将这些信息读入熊猫数据帧。

我目前有;

import pandas as pd
input = pd.read_csv('000000_0', sep='^A')

我得到的错误是

_main__:1: ParserWarning: Falling back to the 'python' engine because the 'c' engine does 
not support regex separators; you can avoid this warning by specifying engine='python'.

然后我不知道我是如何指定行分隔符的。

有什么想法吗?

提前致谢!

5 个答案:

答案 0 :(得分:3)

pd.read_csv与参数<a>

一起使用
sep=chr(1)

答案 1 :(得分:3)

不是提及“ ^ A”,而是提及十六进制代码。它的工作就像一种魅力

import pandas as pd
data = pd.read_csv('000000_0', sep='\x01')

答案 2 :(得分:0)

Python的csv库非常适合读取分隔文件; - )

以上面链接的文档为例:

import csv
with open('eggs.csv', 'rb') as csvfile:
    spamreader = csv.reader(csvfile, delimiter=' ', quotechar='|')
    for row in spamreader:
        print ', '.join(row)

这将自动遍历文件中的行(从而处理换行符),您可以如图所示设置分隔符。

答案 3 :(得分:0)

如果CTRL+A表示SOH的ASCII代码(标题的开头),请先尝试在换行符上拆分数据以获取行,然后将这些行拆分为"\x01",这是SOH的十六进制代码。但是没有任何代码,数据,预期结果或错误消息,这主要是猜测。

答案 4 :(得分:0)

尝试一下

 2:5   error    Expected catch() or return                  promise/catch-or-return
 2:49  warning  Unexpected function expression              prefer-arrow-callback
 2:49  error    Each then() should return a value or throw  promise/always-return
 3:31  warning  Unexpected function expression              prefer-arrow-callback