我对python和编程有点新意。在我的代码中,我为每个音频文件开发了一个功能(这是一个包含39个元素的一维数组)。我想将文件的名称,功能及其目标值{0,1}写入CSV文件以训练我的SVM分类器。我使用CSV编写器如下。
with open('train.csv', 'a') as csvfile:
albumwriter = csv.writer(csvfile, delimiter=' ')
albumwriter.writerow(['1.03 I Want To Hold Your Hand'] + Final_feature + [0] )
我想将大约180个音频文件的详细信息写入此CSV文件并将其提供给SVM分类器。我用来读取文件的代码是:
with open('train.csv', 'rb') as csvfile:
albumreader = csv.reader(csvfile, delimiter=' ')
data = list()
for row in albumreader:
data.append(row[0:])
data = np.array(data)
我可以将第一行中的文件名称作为data[0][1]
,将该功能作为data[0][2]
访问,但它们都在<type 'numpy.string_'>
中。我想将该功能转换为浮动列表。主要问题似乎是','
分隔列表中的元素。我尝试使用.astype(np.float),但徒劳无功。
有人能建议我将CSV文件中的字符串转换回浮点数的好方法吗?非常感谢您的帮助,因为我没有多少时间来完成这个项目。提前致谢。
编辑:根据评论,这就是我的train.csv的样子:
"1.01 I saw her standing there" "[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38]" 0
"1.02 I saw her" "[2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40]" 0
"1.03 I want to hold your hand" "[3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41]" 1
答案 0 :(得分:1)
我没有得到您想要实现的内容,但假设Final_feature是一个浮点数的python列表,并根据您编写csv文件的代码片段,您将列表作为字符串,可能看起来像这个:(你得到数据[0] [2])
feature = '[3.14, 2.12, 4.5]' # 3 elements only for clarity
您询问如何将此字符串转换为float,您可以使用:
map(float, feature[1:-1].split(','))
作为参考,map将其第一个参数应用于第二个参数的每个元素,从而转换float中的每个字符串并返回一个浮点列表。
另一个解决方案是将Final_feature的每个元素写在一个单独的列中。
答案 1 :(得分:1)
转换字符串&#34; [1.0,2.0,3.0]&#34;列出[1.0,2.0,3.0]:
# string to convert
s = '[1.0, 2.0, 3.0]'
lst = [float(x) for x in s[1: -1].split(',')]
# and result will be
[1.0, 2.0, 3.0]
这适用于标准python字符串类型和numpy.string类型。
答案 2 :(得分:0)
从我所看到的,变量Final_feature
是浮点数列表?在哪种情况下
关于你如何编写文件,以下将导入数据
with open('train.csv', 'rb') as csvfile:
albumreader = csv.reader(csvfile, delimiter=' ')
audio_file_names = []
final_features = []
target_values = []
for row in albumreader:
audio_file_names.append(row[0])
final_features.append([float(s) for s in row[1:-1]])
target_values.append([int(s) for s in row[-1]])
有两个list comprehensions将数据转换为浮点数和整数。