在Python 3和pandas中,我使用下面的命令创建一个新的数据帧。
在“empresas_brasil”数据框中,在“nome_empresa”列中,我查找以“CONSULTORIA”开头的所有行。
consult = empresas_brasil[empresas_brasil['nome_empresa'].str.startswith("CONSULTORIA", na=False)]
数据框的格式如下所示:
empresas_brasil.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 8952217 entries, 0 to 8952216
Data columns (total 4 columns):
Unnamed: 0 int64
cnpj int64
nome_empresa object
estado object
dtypes: int64(2), object(2)
memory usage: 273.2+ MB
但现在我需要创建另一个daframe,在“nome_empresa”栏中的任何地方找到“CONSULTORIA”一词,而不仅仅是开头
拜托,有谁知道我怎么能这样做?
答案 0 :(得分:2)
您需要str.contains
更改startswith
:
mask = empresas_brasil['nome_empresa'].str.contains("CONSULTORIA", na=False)
consult = empresas_brasil[mask]