基于dask中的多个条件的行方式选择?

时间:2016-11-16 09:09:58

标签: python numpy dask

根据多个条件选择行时,dask中性能最高的方法是什么?在熊猫中,像

df[df.A > 0 & df.B <= 10]

确实有效。但是,在dask中,这将返回错误。到目前为止我提出的最佳解决方案是使用numpys logical_and()函数:

df[np.logical_and(df.A > 0, df.B <= 10)]

然而,这是超级慢,因为它触发了几个计算(我假设)。是否有更高效的方法可以根据多种条件在dask中选择行?

2 个答案:

答案 0 :(得分:2)

由于@joris的暗示,正确位置的括号工作。因此,dask中的解决方案与pandas解决方案类似/相同:

df[(df.A > 0) & (df.B <= 10)]

答案 1 :(得分:0)

尝试

from selenium import webdriver
from selenium.webdriver.common.proxy import Proxy, ProxyType

prox = Proxy()
prox.proxy_type = ProxyType.MANUAL
prox.http_proxy = "ip_addr:port"
prox.socks_proxy = "ip_addr:port"
prox.ssl_proxy = "ip_addr:port"

capabilities = webdriver.DesiredCapabilities.CHROME
prox.add_to_capabilities(capabilities)

driver = webdriver.Chrome(desired_capabilities=capabilities)

等同于逻辑AND