对于问过一百次问过的问题道歉,我是Python的新手,我找到的解决方案似乎都解决了我的问题。
我有一个名为糖尿病的csv文件的嵌套列表,我在文件中读到并用逗号分隔这样的元素
for line in open("diabetes.csv"):
lst=line.strip().split(",")
print(lst)
打印出以下内容
['10', '101', '86', '37', '0', '45.6', '1.136', '38', '1']
['2', '108', '62', '32', '56', '25.2', '0.128', '21', '0']
['3', '122', '78', '0', '0', '23', '0.254', '40', '0']
现在我的问题是
我正在使用Python 3.6,我在这里拔头发。
答案 0 :(得分:3)
假设您有一个字符串列表列表:
LoL=[
['10', '101', '86', '37', '0', '45.6', '1.136', '38', '1'],
['2', '108', '62', '32', '56', '25.2', '0.128', '21', '0'],
['3', '122', '78', '0', '0', '23', '0.254', '40', '0'],
]
您可以像这样获取每个子列表的nth
元素:
>>> [float(sl[2]) for sl in LoL]
[86.0, 62.0, 78.0]
如果您有csv文件,请使用csv module执行完全相同的操作:
(在命令提示符下):
$ cat file.csv
10,101,86,37,0,45.6,1.136,38,1
2,108,62,32,56,25.2,0.128,21,0
3,122,78,0,0,23,0.254,40,0
的Python:
import csv
with open('file.csv') as f:
items=[float(row[2]) for row in csv.reader(f)]
>>> items
[86.0, 62.0, 78.0]
所以 - 底线:
csv
或pandas
代替.split(',')
,以便您可以正确处理引用的csv和其他特殊情况; with
上下文管理器,以便在块结束时自动关闭文件; csv
文件与列表列表非常相似,通常可以采用相同的方式处理。 答案 1 :(得分:0)
您可以使用pandas
模块,这在数据科学中非常标准:
import pandas as pd
df = pd.read_csv("diabetes.csv", header=None, index_col=None)
df.iloc[:, 2] = pd.to_numeric(df.iloc[:, 2], downcast='float')
list = df.iloc[:, 2]
修改强>
请注意,此处的输出类型为Series
答案 2 :(得分:0)
一个非常简单和天真的单线:
result = [float(line.strip().split(",")[2]) for line in open("diabetes.csv")]
答案 3 :(得分:-1)
以下是您可以做的事情:
my_list = []
with open("diabetes.csv", 'rb') as csvfile:
for line in csvfile.readlines():
lst = line.split(',')
my_list.append(float(lst[2]))