Question

我使用此代码使用.dat

从read_table文件中读取数据

import pandas as pd
rnames = ['user-id','movie-id','rating','timestamp']
ratings = pd.read_table('C:\\Users\\IBM_ADMIN\\Desktop\\ml-1m\\ratings.dat', sep='::', header=None,names=rnames,encoding='utf8',engine='python')

来自.dat文件的数据如下：

从dat阅读后，显示如下：

不知道为什么第一行将被视为movie-id，rating和timestamp的NaN。

Answer 1

我尝试在Linux（Ubuntu）中重现您的问题，但它运行正常：

import pandas as pd                                                          

rnames = ['user-id','movie-id','rating','timestamp']                         
ratings = pd.read_table('ratings.dat', sep='::',header=None,names=rnames,encoding='utf8',engine='python')

print ratings

我的ratings.dat

1::1193::5::12345
1::661::3::123456
1::662::3::1234567

输出：

   user-id  movie-id  rating  timestamp
0        1      1193       5      12345
1        1       661       3     123456
2        1       662       3    1234567

所以我猜你的Windows环境可能存在一些问题，除了上面显示的代码。

read_table无法正确读取.dat文件的第一行

1 个答案: