我正在处理我的数据。
使用pandas时遇到问题
这是代码。
import pandas as pd
import numpy as np
import os
join_file2 = r'D:\raw data\서울시 공공데이터\5.16년7월분\17.상권-추정매출\tbsm_trdar_selng.txt\tbsm_trdar_selng_utf8.txt'
os.chdir(os.path.dirname(join_file2))
join_data2 = pd.read_csv(os.path.basename(join_file2),sep='|',
header=None ,
usecols=[0,1,2,3,4,11],
names=['STDR_YM_CD', 'TRDAR_CD', 'TRDAR_CD_NM', 'SVC_INDUTY_CD','SVC_INDUTY_CD_NM','THSMON_SELNG_AMT'],
dtype = { '0' : int},
encoding='utf-8' )
join_data2_d = join_data2[(join_data2.SVC_INDUTY_CD != 'CS000000') | (join_data2.SVC_INDUTY_CD != 'CS100000') | (join_data2.SVC_INDUTY_CD != 'CS200000')| (join_data2.SVC_INDUTY_CD != 'CS300000') ]
答案 0 :(得分:1)
您似乎正在尝试过滤掉SVC_INDUTY_CD
不等于多个值的行。您应该使用isin
方法并使用一元运算符~
join_data2_d = join_data2[~join_data2.SVC_INDUTY_CD.isin(['CS000000',
'CS100000',
'CS200000',
'CS300000'])]