我有一个大CSV文件(60000行)。我想逐行读取该CSV并找到每一行的分位数,然后再次想按每一行值比较每一行的分位数。如果大于打印在其他下方。
CSV文件 测试1
标题A B C D .....
h1 1 2 3 4 5 ....
h2 2 3 5 6 7 .....
h3 3 4 5 6 7 ..... 。 。
计数分位数 test1 ['Quantile'] = test1.quantile(.75,轴= 1)
然后比较值: test1.loc [test1 ['h1'] <3.291224(分位数),'表达状态'] ='低于' test1.loc [test1 ['h1']> = 3.291224,'表达状态'] ='结束'
请为大型数据集提供一些帮助... 我有60482(行)和502(列)