我正在搜索向我的数据框(dfProc)添加列'id'的方式,其中顺序编号从1(或零)到行数(在此示例中,它有10行,但我的df具有可变行)
我的dfProc的内容:
+-----+-------+------------+
|op_id|op_name|op_procedure|
+-----+-------+------------+
| 90| 39| 4|
| 91| 39| 5|
| 98| 39| 8|
| 111| 39| 11|
| 113| 39| 13|
| 104| 39| 14|
| 94| 39| 15|
| 96| 39| 17|
| 97| 39| 18|
| 93| 39| 21|
+-----+-------+------------+
我想要的最终结果是:
+-----+-------+------------+---+
|op_id|op_name|op_procedure|id |
+-----+-------+------------+---+
| 90| 39| 4| 1|
| 91| 39| 5| 2|
| 98| 39| 8| 3|
| 111| 39| 11| 4|
| 113| 39| 13| 5|
| 104| 39| 14| 6|
| 94| 39| 15| 7|
| 96| 39| 17| 8|
| 97| 39| 18| 9|
| 93| 39| 21| 10|
+-----+-------+------------+---+
注意:我正在使用pyspark 1.5.2。我无法更新到另一个版本。