在CSV文件中编写和读取浮点数和字符串 - python

时间:2014-08-20 12:32:32

标签: python csv numpy svm

我对python和编程有点新意。在我的代码中,我为每个音频文件开发了一个功能(这是一个包含39个元素的一维数组)。我想将文件的名称,功能及其目标值{0,1}写入CSV文件以训练我的SVM分类器。我使用CSV编写器如下。

with open('train.csv', 'a') as csvfile:
    albumwriter = csv.writer(csvfile, delimiter=' ')
    albumwriter.writerow(['1.03 I Want To Hold Your Hand'] + Final_feature + [0] )

我想将大约180个音频文件的详细信息写入此CSV文件并将其提供给SVM分类器。我用来读取文件的代码是:

with open('train.csv', 'rb') as csvfile:
    albumreader = csv.reader(csvfile, delimiter=' ')
    data = list()
    for row in albumreader:
        data.append(row[0:]) 
data = np.array(data)

我可以将第一行中的文件名称作为data[0][1],将该功能作为data[0][2]访问,但它们都在<type 'numpy.string_'>中。我想将该功能转换为浮动列表。主要问题似乎是','分隔列表中的元素。我尝试使用.astype(np.float),但徒劳无功。

有人能建议我将CSV文件中的字符串转换回浮点数的好方法吗?非常感谢您的帮助,因为我没有多少时间来完成这个项目。提前致谢。

编辑:根据评论,这就是我的train.csv的样子:

"1.01 I saw her standing there" "[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38]" 0

"1.02 I saw her" "[2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40]" 0

"1.03 I want to hold your hand" "[3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41]" 1

3 个答案:

答案 0 :(得分:1)

我没有得到您想要实现的内容,但假设Final_feature是一个浮点数的python列表,并根据您编写csv文件的代码片段,您将列表作为字符串,可能看起来像这个:(你得到数据[0] [2])

feature = '[3.14, 2.12, 4.5]' # 3 elements only for clarity

您询问如何将此字符串转换为float,您可以使用:

map(float, feature[1:-1].split(','))

作为参考,map将其第一个参数应用于第二个参数的每个元素,从而转换float中的每个字符串并返回一个浮点列表。

另一个解决方案是将Final_feature的每个元素写在一个单独的列中。

答案 1 :(得分:1)

转换字符串&#34; [1.0,2.0,3.0]&#34;列出[1.0,2.0,3.0]:

# string to convert
s = '[1.0, 2.0, 3.0]'

lst = [float(x) for x in s[1: -1].split(',')]

# and result will be
[1.0, 2.0, 3.0]

这适用于标准python字符串类型和numpy.string类型。

答案 2 :(得分:0)

从我所看到的,变量Final_feature是浮点数列表?在哪种情况下 关于你如何编写文件,以下将导入数据

with open('train.csv', 'rb') as csvfile:
    albumreader = csv.reader(csvfile, delimiter=' ')

    audio_file_names = []
    final_features = []
    target_values = []
    for row in albumreader:
        audio_file_names.append(row[0])
        final_features.append([float(s) for s in row[1:-1]])
        target_values.append([int(s) for s in row[-1]])

有两个list comprehensions将数据转换为浮点数和整数。