我正在努力将数组转换为单个标记。 目前我使用了以下代码,但没有得到我想要的确切输出。因为我也希望数字成为其中的一部分。
text = df.head(3)[['processed_arti', 'cluster']].values // where df is a pandas dataframe
terms = [b for l in text for b in zip (l[0].split(" "))]
我在下面添加了另一张图片,显示了数据外观的更多细节。读入 Pandas 数据帧。
我真的很感激这方面的任何帮助。提前致谢。
答案 0 :(得分:2)
这不是你需要的吗?你只需要在你的话旁边加上数字:
ENV ["COLUMNS"] = 72
using Knet, MLDatasets, IterTools
struct Conv; w; b; f; end
(c :: Conv) (x) = c.f. (pool (conv4 (c.w, x). + C.b))
Conv (w1, w2, cx, cy, f = relu) = Conv (param (w1, w2, cx, cy), param0 (1,1, cy, 1), f);
答案 1 :(得分:1)
首先你会得到一个包含元组的列表:
[[(word, l[1]) for word in l[0].split('0')] for l in a] # a being your array.
然后您将列表列表展平:参见 How to make a flat list out of list of lists?
或者更好,正如 Yevhen Kuzmovych 建议的那样:
[(word, l[1]) for l in a for word in l[0].split('0')]
注意:未验证。在我的手机上打字。