NodeJS(JavaScript / TypeScript)-读取Parquet文件时出错

时间:2019-03-04 17:35:51

标签: javascript typescript module parquet

我正在尝试使用nodejs读取实木复合地板文件:

var parquet = require('parquetjs');

(
    async () => {
    try {
            // create new ParquetReader that reads from 'fruits.parquet`
      let reader = await parquet.ParquetReader.openFile('f1.snappy.parquet');

        // create a new cursor
        let cursor = reader.getCursor();

        // read all records from the file and print them
        let record = null;
        while (record = await cursor.next()) {
            console.log(record);
        }

      } catch (e) {
        console.log('error while reading a parquet file:\n', e)
      }

    }

) ();

获取错误:

error while reading a parquet file:
 invalid page type: DICTIONARY_PAGE

相同的实木复合地板文件-我可以使用Python pyarrow库进行读取而没有问题。

可能是什么原因?

1 个答案:

答案 0 :(得分:0)

我在parquetjs中遇到了相同的问题(以及其他一些在读取嵌套对象时的问题)

我切换到https://www.npmjs.com/package/parquetjs-lite,现在一切正常

parquetjs-lite是parquetjs的一个分支,因此我不需要更改任何代码