是否有一种方法可以读取Excel工作表中所有可用的数值并找到最大/最大的数值?
我试图从50 x 50数据集中找到最大数据点。因此,基本上,该函数可以分析整个excel文件,而与列和行无关。
我编写了一个函数,该函数将查找每列的最大值,然后再次查找它们之间的最大值。
但是我正在寻找一种更有效的方法。我将处理非常大的文件。
谢谢
答案 0 :(得分:1)
pd.read_csv('.../data.csv').select_dtypes(include=[np.number]).max().max()
返回整个数据帧的最大值。
答案 1 :(得分:0)
以下内容将起作用。查看评论以获取更多详细信息。熊猫是一个很好的图书馆。
import pandas as pd
# file_path should be the full path of wherever your csv file is located
# this loads the csv into a pandas data frame
# a convenient table-like data structure
df = pd.read_csv(file_path)
# get the max values in every column
column_maxes_series = df.max()
# get the max value of the Series
overall_max = column_maxes_series.max()
检查您的数据以确保它是所有数字。它会使用字符串进行处理,但是对于您所做的任何分析都可能很奇怪。另外,显然pd.read_csv()仅适用于csv文件。