处理Jupyter笔记本中的csv数据集

时间:2016-10-11 16:18:38

标签: python csv jupyter tagging

我担心处理用Sindhi语言开发的数据集。我按照所有步骤但无法处理数据集。可以任何人帮助我从本地驱动器加载和导入csv文件。 我尝试过:

import csv
data C:\Users\mazhar\Anaconda3\Lib\site-packages\sindhi2.csv

得到的反应如下:

File "<ipython-input-71-6a0a9456deeb>", line 1
    data C:\Users\mazhar\Anaconda3\Lib\site-packages\sindhi2.csv
         ^
SyntaxError: invalid syntax

然后输入查询:

import csv
with open(C:\Users\mazhar\Anaconda3\Lib\site-packages\sindhi2.csv, 'rb') as f:
    data = list(csv.reader(f))

得到回应:

File "<ipython-input-74-29f185d274e2>", line 2
    with open(C:\Users\mazhar\Anaconda3\Lib\site-packages\sindhi2.csv, 'rb') as f:
               ^
SyntaxError: invalid syntax

比处理:

from sklearn import datasets
sindhi2 = datasets.load_sindhi2()
digits = datasets.load_digits()

得到回应:

AttributeError
Traceback (most recent call last)
<ipython-input-9-119477fe5453> in <module>()
      1 from sklearn import datasets
----> 2 sindhi2 = datasets.load_sindhi2()
      3 digits = datasets.load_digits()

AttributeError: module 'sklearn.datasets' has no attribute 'load_sindhi2'

请帮我从本地驱动器D加载和导入数据集,并处理在jupyter笔记本中导出的POS标记和功能

1 个答案:

答案 0 :(得分:1)

您的第二个块几乎是正确的,您只需要引用文件名:

import csv
with open(r'C:\Users\mazhar\Anaconda3\Lib\site-packages\sindhi2.csv', 'rb') as f:
    data = list(csv.reader(f))

另请注意,我使用了原始字符串(请参阅单引号前的r),这样我就不必逃避退格。

更新

由于您使用的是Python 3,因此应使用模式'r'

with open(r'C:\Users\mazhar\Anaconda3\Lib\site-packages\sindhi2.csv', 'r') as f:

或省略模式:

with open(r'C:\Users\mazhar\Anaconda3\Lib\site-packages\sindhi2.csv') as f:

我用Anaconda + Python 3 Jupyter笔记本试过这个。