Question

我正在对此csv文件进行预处理，但是没有继续-我收到了"TypeError: expected string or bytes-like object"的错误：

import pandas as pd
import numpy as np
import string
import nltk

dataset =pd.read_csv('blogtext.csv')

seq=dataset.iloc[:,6]

输出将是7列的blogtext.csv文件，但出现错误。

Answer 1

我想您的数据集中有浮点值。

您需要将这些浮点值转换为字符串值。

Answer 2

“ pandas.DataFrame.iloc”是基于位置的纯整数索引，用于按位置选择。.iloc[]主要基于整数位置（从0到轴的长度1），但也可以与布尔数组。

例如，

import pandas as pd

mydict = [{'a': 1, 'b': 2, 'c': 3, 'd': 4},
{'a': 100, 'b': 200, 'c': 300, 'd': 400},
{'a': 1000, 'b': 2000, 'c': 3000, 'd': 4000 }]

df = pd.DataFrame(mydict)

print(df.iloc[0])

'''
Output:
a    1
b    2
c    3
d    4
'''

df.iloc[[0]]

'''
Output
   a  b  c  d
0  1  2  3  4
'''

df.iloc[[0, 1]]

'''
Output
     a    b    c    d
0    1    2    3    4
1  100  200  300  400
'''

df.iloc[:3]

'''
Output
      a     b     c     d
0     1     2     3     4
1   100   200   300   400
2  1000  2000  3000  4000
'''

使用nltk在Python中读取CSV文件时出现“ TypeError：预期的字符串或类似字节的对象”

2 个答案: