我正在读取以制表符分隔的.txt文件作为熊猫数据框。在该文件中,我有如下条目:
user1 2013 02 12 10
nan 2013 02 12 10
null 2013 03 05 6
我这样读文件:
with open('usernames_2013.txt', 'r') as f:
df3 = pd.read_csv(f, sep='\t', header=None)
df3.columns=["ID", "Year", "Month", "Day", "Hour"]
我得到以下信息:
ID Year Month Day Hour
170667 user1 2013 2 12 10
ID Year Month Day Hour
170668 NaN 2013 2 12 10
ID Year Month Day Hour
262842 NaN 2013 3 5 6
我使用以下代码获取了这些行:
print(payload3.loc[[170667]])
print(payload3.loc[[170668]])
print(payload3.loc[[262842]])
因此,user1在行170667中,nan在行170668中,null在行262842中。文件中有nan和null的多个实例,这只是一个示例。
我希望nan
和null
都是有效的字符串;它们不应为NaN
。我该怎么做?