标签: apache-spark-sql
我正在使用Spark SQL在存储在Amazon S3上的json日志之上构建查询UI。在UI中,大多数查询都使用limit来恢复最佳结果。通常只是前十名。
是否有一种方法可以使用spark sql显示与查询匹配的总行数,而无需将查询作为计数重新运行?