我尝试读取一个.xlsx文件,我得到了nan的值。 我实际上也在将xls文件转换为xlsx,但我还没有发布这部分代码。也许这会影响事情。 我需要解析这些数据以获得分数,但是当我读取文件时,我无法看到分数。 我试过了 data = pd.read_excel(r“C:\ selenium \ neww.xlsx”,header = 0,converters = {'Priority Class':str,1:int}) 但它没有帮助。
表格:
Priority Score Date
This Week 100 1/24/2018
This Week 100 1/20/2018
This Week 99.1 1/29/2018
#code
url = "site"
isa_list="&org=US&to=&utf8=%E2%9C%93"
# Set full screen
browser.maximize_window()
# Allow browser to load
browser.set_page_load_timeout(60)
# Go to url
browser.get(url)
exp_btn = WebDriverWait(browser, 30).until(ec.presence_of_element_located((
By.XPATH, """html/body/div[4]/a""")))
browser.execute_script("arguments[0].click();", exp_btn)
# Wait for file to download
while not glob.glob(homedir + "/Downloads/*.xlsx"):
t.sleep(5)
if glob.glob(homedir + "/Downloads/*.xlsx"):
print("file downloaded")
browser.close()
# Find name of latest file downloaded
list_of_files = glob.glob(homedir + "/Downloads/*.xlsx")
latest_file = max(list_of_files, key=os.path.getctime)
data = pd.read_excel(r"C:\selenium\neww.xlsx",header=0,converters={'Priority Class':str, 1:int})
df = pd.DataFrame(data)
print(df)
结果:
Priority Score Date
NaN Nan NaT
NaN NaN NaT
This Week 100 2018-01-24
NaN NaN NaT
NaN NaN NaT
This Week 100 2018-01-20
答案 0 :(得分:0)
运行:
df = df[np.isfinite(df['SKUs'])]
解决了我与Nans的问题。 我只使用SKU列中单元格中有数字的行来获取此代码。 仔细检查后,excel文件有许多合并的单元格。 这就是其他解析方法不起作用的原因。