SnappyData v.0.5
我想做一些类似于加载镶木地板文件的内容,如QuickStart加载脚本中所示。
使用镶木地板选项创建表格STAGING_AIRLINEREF(路径 ' ../../快速启动/数据/ airportcodeParquetData&#39);
但是,我有CSV文件而不是镶木地板文件。我没有看到"使用镶木地板"或任何RowStore文档中的CSV版本,所以我猜了一下,这失败了。
使用csv OPTIONS创建表STAGING_ROADS(路径' roads.csv');
如何直接从CSV文件创建表格,其中标题行是列名,其余的是作为数据行加载?
行。遵循Spark-CSV语法,我加载此文件并获得零行或表。
"roadId","name"
"1","Road 1"
"2","Road 2"
"3","Road 3"
"4","Road 4"
"5","Road 5"
"6","Road 6"
"7","Road 7"
"8","Road 8"
"9","Road 9"
"10","Road 10"
snappy> run '/home/ubuntu/data/example/load_roads.sql';
snappy> SET SCHEMA A;
0 rows inserted/updated/deleted
snappy> DROP TABLE IF EXISTS STAGING_ROADS;
0 rows inserted/updated/deleted
snappy> CREATE TABLE STAGING_ROADS
(road_id string, name string)
USING com.databricks.spark.csv
OPTIONS(path '/home/ubuntu/data/example/roads.csv', header 'true');
0 rows inserted/updated/deleted
答案 0 :(得分:4)
您可以使用以下方式:
CREATE TABLE STAGING_ROADS USING com.databricks.spark.csv OPTIONS(path 'roads.csv', header "true");
答案 1 :(得分:1)
是的,不幸的是,shell显示了JDBC返回的集合,可能会误导DDL命令。请注意,即使对于' SET SCHEMA'也是如此。 添加了新的JIRA来跟踪此问题 - https://jira.snappydata.io/browse/SNAP-940。