所以我有一个熊猫数据框,它是这样的:
这是一段[if语句,for循环]
这是第二段[for-loop,java]
为说明起见,左列用作文本数据,右列对文本数据进行分类。
我只想在第二段中访问“ java”。如何访问数据框中的列表?
答案 0 :(得分:1)
IIUC需要
df = pd.DataFrame({'col1':['This is a paragraph','This is a second paragraph'],
'col2':[['if-statement', 'for-loop'],['for-loop','java']]})
df = df[df['col2'].apply(lambda x: 'java' in x)]
#alternative solution
#df = df[['java' in x for x in df['col2']]]
或比较set
:
df = df[df['col2'].apply(set) >= set(['java'])]
print (df)
col1 col2
1 This is a second paragraph [for-loop, java]
答案 1 :(得分:0)
如何使用map
。
>>> df['col2'].map(str)[1]
"['for-loop', 'java']"