从pyspark数据帧中的字符串列中提取单词

时间:2018-02-20 09:47:13

标签: python pyspark

我有一个包含许多行和列的数据框。我想从单独的列中的一列中提取单词。

现有的Dataframe

|               title|          sale_price|      condition_id|

|"Lenovo ThinkPad ...|              599.00|        1500|
|ASUS ROG GL752VW-...|              999.99|        2000|
|Lenovo IdeaPad S1...|               71.00|        3000|
|Lenovo T520 i5 2....|              210.00|        2500|
|"Dell Inspiron 15...|              508.72|        1000|
|7 Apple Macbook P...|              446.00|        7000|
|Dell Latitude E64...|               41.00|        3000|

我想拆分

**brand column**  :         **model**    :     **model_num** :      **other**


lenovo  :                   thinkpad  :       4500U  :          8GB RAM 256GB

dell          :             inspiron   :     GL752VW

hp:

dell       :                latitude:

有什么方法可以在pyspark datafram中获取我需要的数据

0 个答案:

没有答案