我正在对此csv文件进行预处理,但是没有继续-我收到了"TypeError: expected string or bytes-like object"
的错误:
import pandas as pd
import numpy as np
import string
import nltk
dataset =pd.read_csv('blogtext.csv')
seq=dataset.iloc[:,6]
输出将是7列的blogtext.csv文件,但出现错误。
答案 0 :(得分:0)
我想您的数据集中有浮点值。
您需要将这些浮点值转换为字符串值。
答案 1 :(得分:0)
“ pandas.DataFrame.iloc”是基于位置的纯整数索引,用于按位置选择。.iloc[]主要基于整数位置(从0到轴的长度1),但也可以与布尔数组。
例如,
import pandas as pd
mydict = [{'a': 1, 'b': 2, 'c': 3, 'd': 4},
{'a': 100, 'b': 200, 'c': 300, 'd': 400},
{'a': 1000, 'b': 2000, 'c': 3000, 'd': 4000 }]
df = pd.DataFrame(mydict)
print(df.iloc[0])
'''
Output:
a 1
b 2
c 3
d 4
'''
df.iloc[[0]]
'''
Output
a b c d
0 1 2 3 4
'''
df.iloc[[0, 1]]
'''
Output
a b c d
0 1 2 3 4
1 100 200 300 400
'''
df.iloc[:3]
'''
Output
a b c d
0 1 2 3 4
1 100 200 300 400
2 1000 2000 3000 4000
'''