在spark-SQL中创建一个“临时”表,而不是spark-scala?

时间:2017-12-07 00:36:12

标签: apache-spark apache-spark-sql hiveql

我已从输入文件中加载了一个表。

CREATE TABLE MyTable (
    ID INT,
    VALUE FLOAT,
    RATE  INT
...

LOAD DATA LOCAL INPATH 'MYPATH' INTO TABLE MyTable;

现在我想基于这个创建一个新的

DerivedTable = 
    SELECT ID, VALUE*RATE AS Total
    FROM MyTable
    WHERE VALUE IS NOT NULL;

然后我将使用此表作为其他表和输出的源。

创建此“临时”表的正确Sql(或Hive)方法是什么?这应该适用于spark-sql

PS:我知道如何在spark-shell中做到这一点。但这不是我想要的。

1 个答案:

答案 0 :(得分:2)

你可以:

CREATE TEMPORARY VIEW DerivedTable AS (
   SELECT ID, VALUE*RATE AS Total
   FROM MyTable
   WHERE VALUE IS NOT NULL);