Head(),切片和列操作的DataFrame顺序中的性能差异

时间:2019-12-07 01:29:14

标签: python-3.x pandas numpy dataframe nlp

我正在研究BILUO标签,并在它们通过NLP模型运行之后对标签进行一些处理。我想通过使用以下命令检查Pandas DataFrame输出是否包含'-'字符:

<ion-nav #nav [root]="rootPage">
  <ion-header>
    <ion-toolbar>
      <ion-title>
           App
      </ion-title>
    </ion-toolbar>
  </ion-header>

  <ion-content>
    <div class="ion-padding">
    <ion-button (click)="go()" expand="block">Start</ion-button>
  </ion-content>
</ion-nav>

在每个方法包装的开头和结尾处使用time.time()进行计时时,性能如下:

最快时间<第二最快时间<最慢时间

方法3 <方法2 <方法1

我试图理解为什么会这样。我也想知道这种趋势是否会逆转。我目前为此使用> 20000个数据点,并试图理解为什么首先获得优先/过滤列(这是Pandas系列)的机制对性能至关重要。我猜想这更多地与较低级别的Pandas或numPy实现有关,但我想了解引擎盖下的实际情况。

0 个答案:

没有答案