如何导入PGN文件进行机器学习

时间:2019-02-13 14:46:15

标签: python pandas csv

我正在尝试在python中创建一个数据框,以便在国际象棋AI上执行一些机器学习任务。我在打印数据框时遇到问题。

我正在使用熊猫读取csv文件。该文件最初是一个pgn文件,我只是将其另存为csv文件。我正在使用pandas.head()尝试读取所述文件。

import pandas as pd
Fischer_games = pd.read_csv("/home/rhulain/Desktop/Python Projects/Fischer_ai/Fischer_dataset.csv", sep=".")
print(Fischer_games.head())

我希望看到csv文件的前5个项目在每个期间都分开。这将是文件中第一个国际象棋游戏中的前5个动作。

相反,我收到此错误:

  

ParserError:标记数据时出错。 C错误:第3行中应有1个字段,看到了3

我的直觉是,csv文件的格式某种程度上使熊猫解析器无法很好地处理它。在那种情况下,我不确定如何格式化csv文件中的信息以使熊猫正确读取它。

1 个答案:

答案 0 :(得分:0)

我找到了解决方案。问题在于空白数据列被读取为数据。

以下代码对其进行了修复:

bob_games = pd.read_csv("/home/rhulain/Desktop/Python Projects/bob_ai/Fischer_dataset.csv", sep='delimiter', header=None)