在不使用\ n字符的情况下解析json

时间:2019-11-25 19:52:26

标签: scala akka akka-stream

我目前正在实现一个Akka Stream Scala应用程序,该应用程序读取一个包含如下格式推文的压缩文件(使用json):

jestTestresults.trx

我已经成功读取了文件的解压缩信息,但是我现在正尝试将流分成多个小块,以使每个块包含一个tweet的表示形式,它对应于上面的代码片段中的一行。 / p>

我尝试将以下内容用作实现此目的的流程:

{"created_at": "Mon Nov 04 14:37:29 +0000 2019", ... }
{"created_at": "Mon Nov 04 14:37:29 +0000 2019", ... }

但是问题是,在json中有一个属性“ full_text”,表示推文的内容。该文本可能包含\ n字符,导致上述代码段不起作用,因为它也会在这些\ n文本字符处拆分。下面的例子。

Framing.delimiter(ByteString("\n"), 50000)

有人知道这个问题的解决方案吗?

1 个答案:

答案 0 :(得分:6)

看来Akka的JSON框架就是为此目的而制作的:

https://doc.akka.io/docs/alpakka/current/data-transformations/json.html