编译和解析数百万个文件

时间:2019-01-21 09:52:12

标签: apache-spark parsing compilation bigdata

我有数百万个文件,它们以自定义语法编写,具有类似C的语法。我也有一个用Java编写的词法分析器和解析器,用于将此自定义语言转换为C。 对于如何每天解析和编译几百万个这些文件,我需要一些指导。 我应该选择Spark / Pandas框架吗? 那会非常昂贵的内存吗?

0 个答案:

没有答案