将标记化单词组合成熊猫的单个列表

时间:2018-06-22 07:58:29

标签: arrays python-3.x pandas

我有一个pandas数据框,其列为'tokenized_texts':-

Tokenized_texts

[obama,america,counterpart]
[trump,election]
[development,china,canada]
..................
.................
................
[football,world,cup]

我想将其转换为包含所有标记词的单个列表:

预期产量

[obama,america,counterpart,trump,election,development,china,canada,.......,world,cup]

1 个答案:

答案 0 :(得分:0)

您可以直接使用pandas.Series.sum来获取所需的列表。

@SpringBootApplication
public class Application {
    @Value("${unitTest}")
    boolean unitTest = false;

    public static void main(String[] args) {
        SpringApplication.run(Application.class, args);
    }

    @Bean
    public CommandLineRunner processTransactions(TransactionLogRepository repository) {
        return (args) -> {
            if (unitTest) {
                return;
            }