如何在pyspark中添加新列并将其值基于其他列?

时间:2020-04-26 06:37:06

标签: python pyspark unsupervised-learning

我有一个nogk is a data frame with mutliple columns数据集,现在我想创建一个新列filed_position,它仅基于位置取3个值。the new column can only take 3 values defender,forward or middle。什么是解决的最佳方法?使用以下代码或循环遍历位置code i used ,but i need to get "DEF"for all values which are in DEFENDER list

1 个答案:

答案 0 :(得分:0)

要将值与提供的列表进行比较,您需要使用isin函数 并且w =进行链接时需要做多次比较。

          Container(
            decoration: BoxDecoration(
              border: Border(
                left: Divider.createBorderSide(
                  context,
                  color: Theme.of(context).textTheme.headline.color,
                ),
              ),
            ),
            child: IconButton(
              icon: Icon(Icons.share),
              onPressed: () => Navigator.of(context).pop(),
            ),
          ),

其中DEFENDER,FORWARD和MIDDLE是您要比较的值列表。

希望有帮助。