如何在Python中的CSV文件中找到最大数据点?

时间:2018-07-17 20:54:00

标签: python pandas

是否有一种方法可以读取Excel工作表中所有可用的数值并找到最大/最大的数值?

我试图从50 x 50数据集中找到最大数据点。因此,基本上,该函数可以分析整个excel文件,而与列和行无关。

我编写了一个函数,该函数将查找每列的最大值,然后再次查找它们之间的最大值。

但是我正在寻找一种更有效的方法。我将处理非常大的文件。

谢谢

2 个答案:

答案 0 :(得分:1)

pd.read_csv('.../data.csv').select_dtypes(include=[np.number]).max().max()

返回整个数据帧的最大值。

答案 1 :(得分:0)

以下内容将起作用。查看评论以获取更多详细信息。熊猫是一个很好的图书馆。

import pandas as pd

# file_path should be the full path of wherever your csv file is located
# this loads the csv into a pandas data frame
# a convenient table-like data structure
df = pd.read_csv(file_path)

# get the max values in every column 
column_maxes_series = df.max()

# get the max value of the Series
overall_max = column_maxes_series.max()

检查您的数据以确保它是所有数字。它会使用字符串进行处理,但是对于您所做的任何分析都可能很奇怪。另外,显然pd.read_csv()仅适用于csv文件。