我有几个.csv文件,我想从这些文件中绘制一个图表。 这些文件包含两列,每列csv文件的第一列相同。
file1.csv:
20 -4.140462670
25 -4.140537060
30 -4.140571620
35 -4.140581580
40 -4.140584350
file2.csv:
20 -4.140468880
25 -4.140542900
30 -4.140577590
35 -4.140587560
40 -4.140590330
我尝试使用下面的脚本,以便绘制第一个:
import matplotlib.pyplot as plt
from matplotlib.ticker import FormatStrFormatter
with open('file1.csv') as f:
f=[x.strip() for x in f if x.strip()]
data=[tuple(map(float,x.split())) for x in f[0:]]
oX=[x[0] for x in data]
oY=[x[1] for x in data]
plt.figure(figsize=(9,6))
ax = plt.subplot(111)
ax.yaxis.set_major_formatter(FormatStrFormatter('%.4f'))
ax.plot(oX, oY, color='blue', linestyle='dashdot', linewidth=2, marker='o', markerfacecolor='red', markeredgecolor='black',markeredgewidth=2, markersize=6)
plt.show()
但我想绘制一个包含两条曲线的图形(file1.csv和file2.csv)
在另一个时间,使用以下命令解决问题(使用xmgrace软件):xmgrace -free -nxy *
我的问题是:在读取多个文件后,我可以绘制包含多条曲线的图形。 csv(file1.csv,file2.csv,file3.csv ....)。
我注意到我有:
1)n个CSV (file1.csv,file2.csv,file3.csv ....)。
2)相同的X坐标
3)不同的Y坐标
答案 0 :(得分:1)
解决问题的最简单方法是在for循环中使用Pandas read_csv函数来读取.csv文件,在循环内部创建行,在循环外部生成绘图。
示例:
import os
import pandas as pd
import matplotlib.pyplot as plt
### Set your path to the folder containing the .csv files
PATH = './' # Use your path
### Fetch all files in path
fileNames = os.listdir(PATH)
### Filter file name list for files ending with .csv
fileNames = [file for file in fileNames if '.csv' in file]
### Loop over all files
for file in fileNames:
### Read .csv file and append to list
df = pd.read_csv(PATH + file, index_col = 0)
### Create line for every file
plt.plot(df)
### Generate the plot
plt.show()
输出:
答案 1 :(得分:0)
一般策略是读取,存储和绘制所有数据,仅在绘制完所有内容后调用plt.show()
。举个简单的例子,考虑一下
plt.plot(range(10))
plt.plot(range(0, 20, 2))
plt.show()
答案 2 :(得分:0)
这是我的代码来解决您的问题,使其健壮,以便您可以更好地了解正在发生的事情。您还可以分析许多其他文件,例如 .txt 。此外,在某些情况下,您可能会发现CSV文件与';'分开。这不正确,因为这不是CSV文件应该是什么,但是,您也可以分析该文件。只需确定每个值之间的分隔符,您可以在下面的第二行代码中更改该字符。例如,在您给出的数据中,分隔符是' ' (每个值之间的空格)。请参阅下面的代码,以便了解我的意思:
numFiles = 2 #Number of CSV files in your directory
separator = "," #Character that separates each value inside file
fExtension = ".csv" #Extension of the file storing the data
def MultiplePlots(xValues, allYValues):
'Method to plot multiple times in one figure.'
for yValues in allYValues:
plt.plot(list(map(int, xValues)), list( map(float, yValues) ), label = "file" + str(i))
plt.legend(loc = 'best')
plt.show()
return
def GetXandYValues(coordinates):
'Method to get all coordinates from all CSV files.'
xValues = []
yValues = []
allYValues = []
fst = False
for file in coordinates:
for coordinate in file:
if (fst == False):
xValues.append(coordinate[0])
yValues.append(coordinate[1])
fst = True
allYValues.append( yValues )
yValues = []
return xValues, allYValues
def GetCoordinates( n , separator , fExtension ):
'Iterates through multiple CSV files and storing X values and Y values in different Lists'
coordinates = [] #coordinates[0] = x values --- coordinates[1] = y values
for i in range(n):
coordinates.append( FillList( ReadFile("file" + str(i+1) + fExtension), separator ) )
return coordinates
def ReadFile(path):
'Function to read CSV file and store file data rows in list.'
try:
fileCSV = open(path,"r") #Opens file
data = fileCSV.read() #Save file data in string
listData = data.splitlines() #Split lines so you have List of all lines in file
fileCSV.close() #Close file
finally:
return listData #Return list with file's rows
def FillList(myList, separator):
'With this method you make a list containing every row from CSV file'
valueTemp = ""
listTemp = []
newList = []
for line in myList:
for c in line:
if c != separator:
valueTemp += c
else:
listTemp.append( valueTemp )
valueTemp = ""
listTemp.append( valueTemp )
newList.append(listTemp[:])
valueTemp = ""
del listTemp[:]
return newList
xValues = GetXandYValues( GetCoordinates( numFiles, separator , fExtension) )[0]
allYValues = GetXandYValues( GetCoordinates( numFiles, separator , fExtension) )[1]
MultiplePlots( xValues, allYValues )
结果情节:
如果你想知道这里的每个方法是什么,你可以打印方法(带有所需的参数),这样你就知道返回的是什么,但我认为只有变量名称才能清楚。如果您有任何疑问,请不要犹豫,在下面发表评论。我希望这对你有用。