根据多个条件选择行时,dask中性能最高的方法是什么?在熊猫中,像
df[df.A > 0 & df.B <= 10]
确实有效。但是,在dask中,这将返回错误。到目前为止我提出的最佳解决方案是使用numpys logical_and()
函数:
df[np.logical_and(df.A > 0, df.B <= 10)]
然而,这是超级慢,因为它触发了几个计算(我假设)。是否有更高效的方法可以根据多种条件在dask中选择行?
答案 0 :(得分:2)
由于@joris的暗示,正确位置的括号工作。因此,dask中的解决方案与pandas解决方案类似/相同:
df[(df.A > 0) & (df.B <= 10)]
答案 1 :(得分:0)
尝试
from selenium import webdriver
from selenium.webdriver.common.proxy import Proxy, ProxyType
prox = Proxy()
prox.proxy_type = ProxyType.MANUAL
prox.http_proxy = "ip_addr:port"
prox.socks_proxy = "ip_addr:port"
prox.ssl_proxy = "ip_addr:port"
capabilities = webdriver.DesiredCapabilities.CHROME
prox.add_to_capabilities(capabilities)
driver = webdriver.Chrome(desired_capabilities=capabilities)
等同于逻辑AND