我有一个将内容对象读取到熊猫数据框中的函数。
import pandas as pd
from cStringIO import StringIO, InputType
def create_df(content):
assert content, "No content was provided, can't create dataframe"
if not isinstance(content, InputType):
content = StringIO(content)
content.seek(0)
return pd.read_csv(content)
但是我仍然收到错误TypeError: StringIO() argument 1 must be string or buffer, not cStringIO.StringIO
在函数内部进行StringIO()转换之前,我检查了内容的传入类型,其类型为str
。没有转换,我会得到一个错误,指出str对象没有搜索功能。知道这里有什么问题吗?
答案 0 :(得分:1)
您仅测试了InputType
,这是一个支持阅读的cStringIO.StringIO()
实例。您似乎具有 other 类型OutputType
,该实例是为支持 writing 的实例创建的实例:
>>> import cStringIO
>>> finput = cStringIO.StringIO('Hello world!') # the input type, it has data ready to read
>>> finput
<cStringIO.StringI object at 0x1034397a0>
>>> isinstance(finput, cStringIO.InputType)
True
>>> foutput = cStringIO.StringIO() # the output type, it is ready to receive data
>>> foutput
<cStringIO.StringO object at 0x102fb99d0>
>>> isinstance(foutput, cStringIO.OutputType)
True
您需要测试两种类型,只需使用两种类型的元组作为isinstance()
的第二个参数:
from cStringIO import StringIO, InputType, OutputType
if not isinstance(content, (InputType, OutputType)):
content = StringIO(content)
或者,这是 better 选项,用于测试read
和seek
属性,因此您还可以支持常规文件:
if not (hasattr(content, 'read') and hasattr(content, 'seek')):
# if not a file object, assume it is a string and wrap it in an in-memory file.
content = StringIO(content)
或者您可以只测试字符串和[缓冲区](https://docs.python.org/2/library/functions.html#buffer(),因为它们是StringIO()
可以支持的仅有两种类型:
if isinstance(content, (str, buffer)):
# wrap strings into an in-memory file
content = StringIO(content)
这具有额外的好处,即Python库中的任何其他文件对象,包括压缩文件以及tempfile.SpooledTemporaryFile()
和io.BytesIO()
也将被接受并起作用。