根据存在的值从数据框中选择列

时间:2017-10-16 04:36:55

标签: python pandas dataframe

我有一个包含许多列和行的excel文件。 我想只选择并导入其中一些列,只要它们具有正确的内容(即,如果任何一个列单元格包含CUP

我有以下代码,但我无效。my_excel photo

import pandas as pd
mystring = pd.read_excel("my_excel.xlsx", parse_cols='CUP' in col for cols in my_excel.xlsx, skiprows=[0])
mystring = data.to_string()
print(mystring)


SyntaxError: invalid syntax

输出应该是这样的:

mystring = 'SHOVEL2 CUP UMBRELLA WALLET MIKE GENARAL BASKET COFFEE TEA CUP SCREENING MOVIES'

我在这里附上了我的excel文件照片。

1 个答案:

答案 0 :(得分:1)

就像我提到的那样,您需要首先导入数据,然后对其进行过滤,然后加入已过滤的列。

df = pd.read_excel("my_excel.xlsx", skiprows=[0])
m = df.isin(['CUP']).any(axis=0)
mystring = ' '.join(df.loc[:, m].values.ravel('F'))