我试图用仅包含'let'
中的字符串的行替换DataFrame london
(是另一个no_eco
的副本)中的列contains()
方法。代码如下:
london = no_eco
london.loc[:,'let'] = london.loc[:,'let'].str.contains('E' or 'D' or 'F' or 'G' or 'H' or 'I' or 'J')
london.loc[:,'let'] = london.loc[:,'let'][london.loc[:,'let']]
london = london.dropna(subset = ['let'])
print(london)
代码有效,我删除了不符合字符串的行,但是收到以下警告:
C:\Users\gerardchurch\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas\core\indexing.py:543: SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead
See the caveats in the documentation: http://pandas.pydata.org/pandas- docs/stable/indexing.html#indexing-view-versus-copy
在查看文档时,我仍然不明白我在做什么错。
可以继续使用变量london
,还是将来会遇到问题?
谢谢。
答案 0 :(得分:2)
您的代码有几个问题:
london = no_eco
未为london
分配副本。要明确:london = no_eco.copy()
。pd.Series.str.contains
默认情况下支持正则表达式,因此请使用str.contains('E|D|F|G|H|I|J|')
。object
dtype系列替换为布尔系列,然后为其分配一个由其自身索引的子集,然后使用dropna
(专为 null 值设计)。 / li>
相反,只需构造一个布尔序列,然后将pd.DataFrame.loc
与布尔索引一起使用:
london = no_eco.copy()
london = london.loc[london['let'].str.contains('E|D|F|G|H|I|J|')]
对于这种特殊情况,您可以直接使用pd.DataFrame.__getitem__
(df[]
语法):
london = no_eco.copy()
london = london[london['let'].str.contains('E|D|F|G|H|I|J|')]