使用dl4j RecordReader

时间:2019-05-27 12:49:46

标签: dl4j

我计划在以下格式的数据集上使用dl4j:

  

{“ articles”:[{“ abstractText”:“ text ..”,“ journal”:“ journal ..”,“ meshMajor”:[“ mesh1”,...,“ meshN”],   “ pmid”:“ PMID”,“ title”:“ title ..”,“ year”:“ YYYY”},...,{..}]}

字段meshMajor包含类标签,其余为模型的输入。输入要素是文本数据。

我想知道是否有内置的JSON数据集迭代器,例如CSV迭代器。我在github上发布的示例中查找,但找不到。如果没有一个可用的工具,有人可以提供一些实施建议。

谢谢!

2 个答案:

答案 0 :(得分:0)

答案 1 :(得分:0)

已经在DL4J的问题中问了这个问题,解决方案是使用Jackson记录读取器。 https://github.com/deeplearning4j/DataVec/tree/master/datavec-api/src/main/java/org/datavec/api/records/reader/impl/jackson提供了更多详细信息,有关JSON的示例,请参见

  1. https://github.com/deeplearning4j/DataVec/blob/master/datavec-api/src/test/java/org/datavec/api/records/reader/impl/JacksonLineRecordReaderTest.java

  2. https://github.com/deeplearning4j/DataVec/blob/master/datavec-api/src/test/java/org/datavec/api/records/reader/impl/JacksonRecordReaderTest.java

请注意,JacksonLineRecordReader和JacksonRecordReaderTest.java之间存在区别,前者要求每条JSON记录精确地跨越一行,而后者则需要每条JSON记录一个文件。