使用Python,我想在基于Col1的Col2中搜索文本字符串。因此,在下面的示例中,如果文本/字符串为9880,则在Col2中,我想使用9880.xxx搜索文本,然后将其提取到新列中的新行中。我希望能够对多行执行此操作。 下面的示例全部包含在一个Excel行中,因此col2中的文本全部包含在一个Excel单元格中。
Example: data in Excel
Col1 Col2
9880 | line of text |
single | 9880.01 |
Excel | line of text |
row | 9880.02 |
| line of text |
| 9880.03 |
New column: Colx
Excel row1 9880.01
Excel row2 9880.02
Excel row3 9880.03
我知道如何读取Excel数据并将其保存到数据框并写回Excel。这是我需要帮助的搜索和提取部分。 也许我可以使用Pandas split命令将其关闭,然后融化,然后再使用Groupby。
我试图在Stack溢出中寻找类似的例子,但是这里有些接近:Python - Extract text from string。其他所有与使用VBA有关。 任何建议表示赞赏。
编辑于06/28/2018:我想我可以通过使用'findall'命令来实现这一点,但是不确定如何构造for循环,以便它可以从读取的数据中转到数据帧中的下一项Excel。也许使用我正在搜索的列表中的枚举。
9880 'line of text'
9450 'line of text'
4530 'line of text'