python要基于另一个单元格中的字符串/文本从Excel单元格中提取文本/字符串

时间:2018-06-28 13:30:03

标签: python excel pandas

使用Python,我想在基于Col1的Col2中搜索文本字符串。因此,在下面的示例中,如果文本/字符串为9880,则在Col2中,我想使用9880.xxx搜索文本,然后将其提取到新列中的新行中。我希望能够对多行执行此操作。 下面的示例全部包含在一个Excel行中,因此col2中的文本全部包含在一个Excel单元格中。

Example: data in Excel
             Col1      Col2 
             9880  | line of text  |
 single            | 9880.01       |    
 Excel             | line of text  |
 row               | 9880.02       |  
                   | line of text  |
                   | 9880.03       | 

  New column:  Colx
  Excel row1   9880.01
  Excel row2   9880.02
  Excel row3   9880.03              

我知道如何读取Excel数据并将其保存到数据框并写回Excel。这是我需要帮助的搜索和提取部分。 也许我可以使用Pandas split命令将其关闭,然后融化,然后再使用Groupby。

我试图在Stack溢出中寻找类似的例子,但是这里有些接近:Python - Extract text from string。其他所有与使用VBA有关。 任何建议表示赞赏。

编辑于06/28/2018:我想我可以通过使用'findall'命令来实现这一点,但是不确定如何构造for循环,以便它可以从读取的数据中转到数据帧中的下一项Excel。也许使用我正在搜索的列表中的枚举。

9880    'line of text'
9450    'line of text'
4530    'line of text'

0 个答案:

没有答案