我正在尝试使用nodejs读取实木复合地板文件:
var parquet = require('parquetjs');
(
async () => {
try {
// create new ParquetReader that reads from 'fruits.parquet`
let reader = await parquet.ParquetReader.openFile('f1.snappy.parquet');
// create a new cursor
let cursor = reader.getCursor();
// read all records from the file and print them
let record = null;
while (record = await cursor.next()) {
console.log(record);
}
} catch (e) {
console.log('error while reading a parquet file:\n', e)
}
}
) ();
获取错误:
error while reading a parquet file:
invalid page type: DICTIONARY_PAGE
相同的实木复合地板文件-我可以使用Python pyarrow库进行读取而没有问题。
可能是什么原因?
答案 0 :(得分:0)
我在parquetjs中遇到了相同的问题(以及其他一些在读取嵌套对象时的问题)
我切换到https://www.npmjs.com/package/parquetjs-lite,现在一切正常
parquetjs-lite是parquetjs的一个分支,因此我不需要更改任何代码