Question

SnappyData v.0.5

我想做一些类似于加载镶木地板文件的内容，如QuickStart加载脚本中所示。

使用镶木地板选项创建表格STAGING_AIRLINEREF（路径＆＃39; ../../快速启动/数据/ airportcodeParquetData＆＃39）;

但是，我有CSV文件而不是镶木地板文件。我没有看到＆＃34;使用镶木地板＆＃34;或任何RowStore文档中的CSV版本，所以我猜了一下，这失败了。

使用csv OPTIONS创建表STAGING_ROADS（路径＆＃39; roads.csv＆＃39;）;

如何直接从CSV文件创建表格，其中标题行是列名，其余的是作为数据行加载？

修改

行。遵循Spark-CSV语法，我加载此文件并获得零行或表。

"roadId","name"
"1","Road 1"
"2","Road 2"
"3","Road 3"
"4","Road 4"
"5","Road 5"
"6","Road 6"
"7","Road 7"
"8","Road 8"
"9","Road 9"
"10","Road 10"


snappy> run '/home/ubuntu/data/example/load_roads.sql';
snappy> SET SCHEMA A;
0 rows inserted/updated/deleted
snappy> DROP TABLE IF EXISTS STAGING_ROADS;
0 rows inserted/updated/deleted
snappy> CREATE TABLE STAGING_ROADS
(road_id string, name string)
USING com.databricks.spark.csv
OPTIONS(path '/home/ubuntu/data/example/roads.csv', header 'true');
0 rows inserted/updated/deleted

Answer 1

您可以使用以下方式：

CREATE TABLE STAGING_ROADS USING com.databricks.spark.csv OPTIONS(path 'roads.csv', header "true");

Answer 2

是的，不幸的是，shell显示了JDBC返回的集合，可能会误导DDL命令。请注意，即使对于＆＃39; SET SCHEMA＆＃39;也是如此。添加了新的JIRA来跟踪此问题 - https://jira.snappydata.io/browse/SNAP-940。

如何从CSV创建表格？

修改

2 个答案: