所以我将数据存储在熊猫结构中。我的数据中的一列是由字符串组成的。
1比1,我希望能够通过熊猫结构拉出那根绳子。将其发送到清理它的方法然后将其存储回来。
data = pd.read_csv('ml_dataset_train1.csv', )
data.dropna(how="all", inplace=True)
text = data.loc[data['Id']>=0,['Interview']]
trainDataPercent = 0.75
train_data = text[0:int(trainDataPercent*len(text))]
test_data = text[int(trainDataPercent*len(text)):len(text)]
texts = train_data
for i in range(0, len(texts)):
texts.iat[i, 0] = cd.review_to_words(texts.iat[i, 0])
这给了我一个错误,我的方法期待一个字符串。更奇怪的是,当我检查texts.iat[1, 0]
的类型时,我会得到" class' str'"。
那为什么我的方法不接受呢?