将文本拆分为单独的行 python

时间:2021-02-09 18:14:38

标签: python loops token

我正在努力将数组转换为单个标记。 目前我使用了以下代码,但没有得到我想要的确切输出。因为我也希望数字成为其中的一部分。

text = df.head(3)[['processed_arti', 'cluster']].values    // where df is a pandas dataframe

terms = [b for l in text for b in zip (l[0].split(" "))]

enter image description here

我在下面添加了另一张图片,显示了数据外观的更多细节。读入 Pandas 数据帧。

enter image description here

我真的很感激这方面的任何帮助。提前致谢。

2 个答案:

答案 0 :(得分:2)

这不是你需要的吗?你只需要在你的话旁边加上数字:

ENV ["COLUMNS"] = 72
using Knet, MLDatasets, IterTools
struct Conv; w; b; f; end
(c :: Conv) (x) = c.f. (pool (conv4 (c.w, x). + C.b))
Conv (w1, w2, cx, cy, f = relu) = Conv (param (w1, w2, cx, cy), param0 (1,1, cy, 1), f);

答案 1 :(得分:1)

首先你会得到一个包含元组的列表:

[[(word, l[1]) for word in l[0].split('0')] for l in a] # a being your array.

然后您将列表列表展平:参见 How to make a flat list out of list of lists?

或者更好,正如 Yevhen Kuzmovych 建议的那样:

[(word, l[1]) for l in a for word in l[0].split('0')]

注意:未验证。在我的手机上打字。