我是python的新手,通常进行编程,然后尝试读取.dat文件并将数据插入到postgres表中。
我遇到错误,我已经用谷歌搜索,但无法提出解决方案。希望有人可以指引我正确的方向。
评分表:
UserID int
MovieID int
Rating float
Ratings.dat:
1::122::5::838985046
1::185::5::838983525
下面是我的代码:
import psycopg2
ratingsfile = open('ml-10M100K/ratings.dat', 'r')
for line in ratingsfile:
items = line.split('::')
for values in items:
curr.execute("INSERT INTO Ratings(UserID, MovieID, Rating)
VALUES (%s, %s, %s)", values)
conn.commit()
ratingsfile.close()
错误:
curr.execute("INSERT INTO Ratings(UserID, MovieID, Rating)
VALUES (%s, %s, %s)", values)
IndexError: string index out of range
答案 0 :(得分:0)
您不需要遍历items
。相反,您可以将3个%s
变量分配为items[index]
,如下所示:
import psycopg2
ratingsfile = open('ml-10M100K/ratings.dat', 'r')
for line in ratingsfile:
items = line.split('::')
curr.execute("INSERT INTO Ratings(UserID, MovieID, Rating) VALUES (%s, %s, %s)" % (items[0], items[1], items[2]))
conn.commit()
ratingsfile.close()
例如,假设您的示例Ratings.dat中的UserID为1(items[0]
),MovieID为122和185(items[1]
),并且Rating为5({{1} }。每行末尾的9位整数可以通过items[2]