为Flair模型训练准备数据框

时间:2020-01-11 22:26:46

标签: python-3.x pandas machine-learning nlp flair

我正在尝试将以下格式的数据帧转换为txt文件,如屏幕截图所示。

我与所示的代码相对接近,但是当我尝试将txt读取到ML算法中时遇到以下错误:“ labels = set([label.value for send in self.train for send.labels中的label] ) AttributeError:'NoneType'对象没有属性'labels'“

有人可以帮忙吗?

output['label']=['__label__'+ s for s in output['label'].astype(str)]
output['text']= output['text'].replace('\n',' ', regex=True).replace('\t',' ', regex=True)
output.to_csv(r'sst_train.csv', index=False, sep=' ', header=False)

Input

Output

1 个答案:

答案 0 :(得分:0)

以下似乎有效:

lab = data['label'].tolist()
text = data['text'].tolist()
with open('test.txt', 'w') as outfile:
    for x in range(len(lab)):
        l1 = str(lab[x])
        print(type(l1))
        t1 = str(text[x])
        print(t1)
        d = 'ewdwed'
        message = "__label__{}\t{}\n".format(l1,t1)
        outfile.write(message)