Question

我是python的新手，通常进行编程，然后尝试读取.dat文件并将数据插入到postgres表中。

我遇到错误，我已经用谷歌搜索，但无法提出解决方案。希望有人可以指引我正确的方向。

评分表：

UserID int
MovieID int
Rating float

Ratings.dat：

1::122::5::838985046

1::185::5::838983525

下面是我的代码：

import psycopg2


ratingsfile = open('ml-10M100K/ratings.dat', 'r')
for line in ratingsfile:
    items = line.split('::')
    for values in items:
    curr.execute("INSERT INTO Ratings(UserID, MovieID, Rating)
      VALUES (%s, %s, %s)", values) 

conn.commit()
ratingsfile.close()

错误：

curr.execute("INSERT INTO Ratings(UserID, MovieID, Rating)
VALUES (%s, %s, %s)", values) 

IndexError: string index out of range

Answer 1

您不需要遍历items。相反，您可以将3个%s变量分配为items[index]，如下所示：

import psycopg2


ratingsfile = open('ml-10M100K/ratings.dat', 'r')
for line in ratingsfile:
    items = line.split('::')
    curr.execute("INSERT INTO Ratings(UserID, MovieID, Rating) VALUES (%s, %s, %s)" % (items[0], items[1], items[2]))

conn.commit()
ratingsfile.close()

例如，假设您的示例Ratings.dat中的UserID为1（items[0]），MovieID为122和185（items[1]），并且Rating为5（{{1} }。每行末尾的9位整数可以通过items[2]

访问

插入Postgresql表时使字符串索引超出范围

1 个答案: