用pandas导入xlsx:获得NAN的返回

时间:2018-01-28 01:10:18

标签: python excel

我尝试读取一个.xlsx文件,我得到了nan的值。 我实际上也在将xls文件转换为xlsx,但我还没有发布这部分代码。也许这会影响事情。 我需要解析这些数据以获得分数,但是当我读取文件时,我无法看到分数。 我试过了     data = pd.read_excel(r“C:\ selenium \ neww.xlsx”,header = 0,converters = {'Priority Class':str,1:int}) 但它没有帮助。

表格:

Priority    Score Date          
This Week   100  1/24/2018                  
This Week   100  1/20/2018              
This Week   99.1 1/29/2018  


#code
url = "site"
isa_list="&org=US&to=&utf8=%E2%9C%93"
# Set full screen
browser.maximize_window()

# Allow browser to load
browser.set_page_load_timeout(60)

# Go to url
browser.get(url)

exp_btn = WebDriverWait(browser, 30).until(ec.presence_of_element_located((
By.XPATH, """html/body/div[4]/a""")))
browser.execute_script("arguments[0].click();", exp_btn)

# Wait for file to download
while not glob.glob(homedir + "/Downloads/*.xlsx"):
t.sleep(5)
if glob.glob(homedir + "/Downloads/*.xlsx"):
print("file downloaded")
browser.close()

# Find name of latest file downloaded
list_of_files = glob.glob(homedir + "/Downloads/*.xlsx")
latest_file = max(list_of_files, key=os.path.getctime)
data = pd.read_excel(r"C:\selenium\neww.xlsx",header=0,converters={'Priority Class':str, 1:int})
df = pd.DataFrame(data)
print(df)

结果:

Priority       Score                Date  
 NaN           Nan                  NaT           
 NaN           NaN                  NaT           
 This Week     100           2018-01-24           
 NaN           NaN                  NaT           
 NaN           NaN                  NaT           
 This Week     100           2018-01-20           

1 个答案:

答案 0 :(得分:0)

运行:

df = df[np.isfinite(df['SKUs'])]

解决了我与Nans的问题。 我只使用SKU列中单元格中有数字的行来获取此代码。 仔细检查后,excel文件有许多合并的单元格。 这就是其他解析方法不起作用的原因。