Question

我已从输入文件中加载了一个表。

CREATE TABLE MyTable (
    ID INT,
    VALUE FLOAT,
    RATE  INT
...

LOAD DATA LOCAL INPATH 'MYPATH' INTO TABLE MyTable;

现在我想基于这个创建一个新的

DerivedTable = 
    SELECT ID, VALUE*RATE AS Total
    FROM MyTable
    WHERE VALUE IS NOT NULL;

然后我将使用此表作为其他表和输出的源。

创建此“临时”表的正确Sql（或Hive）方法是什么？这应该适用于spark-sql？

PS：我知道如何在spark-shell中做到这一点。但这不是我想要的。

Answer 1

你可以：

CREATE TEMPORARY VIEW DerivedTable AS (
   SELECT ID, VALUE*RATE AS Total
   FROM MyTable
   WHERE VALUE IS NOT NULL);