Apache Beam的TextIO可用于读取某些文件系统中的JSON文件,但是如何从Java SDK中HTTP响应产生的大型JSON(InputStream)中创建PCollection?
答案 0 :(得分:0)
我不认为see the list of supported IOs目前在Beam中没有通用的内置解决方案。
我可以想到多种解决方法,哪种对您有效,取决于您的要求:
ParDo
,可一步一步读取整个响应,将其拆分并分别输出拆分的元素。然后进一步的转换将解析JSON或做其他事情;