我正在尝试使用jackson-dataformat-csv
解析CSV文件,并且想将数字列映射到Number java类型。
CsvSchema schema = CsvSchema.builder().setUseHeader(true)
.addColumn("firstName", CsvSchema.ColumnType.STRING)
.addColumn("lastName", CsvSchema.ColumnType.STRING)
.addColumn("age", CsvSchema.ColumnType.NUMBER)
.build();
CsvMapper csvMapper = new CsvMapper();
MappingIterator<Map<String, Object>> mappingIterator = csvMapper
.readerFor(Map.class)
.with(schema)
.readValues(is);
while (mappingIterator.hasNext()) {
Map<String, Object> entryMap = mappingIterator.next();
Number age = (Number) entryMap.get("age");
}
我期望entryMap.get("age")
应该是Number
,但我会得到String
。
我的CSV文件:
firstName,lastName,age
John,Doe,21
Error,Name,-10
我知道CsvSchema
在POJO上可以很好地工作,但是我需要处理任意的CSV模式,所以我不能为每种情况创建一个新的Java类。
是否可以将CSV解析为类型为Map
或Array
的任何方法?
答案 0 :(得分:1)
目前无法使用Map
配置CsvSchema
反序列化。进程使用com.fasterxml.jackson.databind.deser.std.MapDeserializer
,它现在不检查架构。我们可以编写自定义Map
反序列化器。 GitHub上有一个问题:CsvMapper does not respect CsvSchema.ColumnType when using @JsonAnySetter,其中cowtowncoder
回答:
在这一点上,模式类型并没有太多用,但是我同意 应该。
我决定进一步了解在幕后使用com.fasterxml.jackson.databind.deser.std.MapDeserializer
的事实,我们可以做些什么。实现将关心类型的自定义Map
反序列化器很难实现和注册,但是我们可以使用有关ValueInstantiator
的知识。让我们定义一个新的Map
类型,它知道如何处理ColumnType
信息:
class CsvMap extends HashMap<String, Object> {
private final CsvSchema schema;
private final NumberFormat numberFormat = NumberFormat.getInstance();
public CsvMap(CsvSchema schema) {
this.schema = schema;
}
@Override
public Object put(String key, Object value) {
value = convertIfNeeded(key, value);
return super.put(key, value);
}
private Object convertIfNeeded(String key, Object value) {
CsvSchema.Column column = schema.column(key);
if (column.getType() == CsvSchema.ColumnType.NUMBER) {
try {
return numberFormat.parse(value.toString());
} catch (ParseException e) {
// leave it as it is
}
}
return value;
}
}
对于没有no-arg
构造函数的新类型,我们应该创建新的ValueInstantiator
:
class CsvMapInstantiator extends ValueInstantiator.Base {
private final CsvSchema schema;
public CsvMapInstantiator(CsvSchema schema) {
super(CsvMap.class);
this.schema = schema;
}
@Override
public Object createUsingDefault(DeserializationContext ctxt) {
return new CsvMap(schema);
}
@Override
public boolean canCreateUsingDefault() {
return true;
}
}
用法示例:
import com.fasterxml.jackson.databind.DeserializationContext;
import com.fasterxml.jackson.databind.MappingIterator;
import com.fasterxml.jackson.databind.ObjectReader;
import com.fasterxml.jackson.databind.deser.ValueInstantiator;
import com.fasterxml.jackson.databind.module.SimpleModule;
import com.fasterxml.jackson.dataformat.csv.CsvMapper;
import com.fasterxml.jackson.dataformat.csv.CsvSchema;
import java.io.File;
import java.io.IOException;
import java.text.NumberFormat;
import java.text.ParseException;
import java.util.HashMap;
public class CsvApp {
public static void main(String[] args) throws IOException {
File csvFile = new File("./resource/test.csv").getAbsoluteFile();
CsvSchema schema = CsvSchema.builder()
.addColumn("firstName", CsvSchema.ColumnType.STRING)
.addColumn("lastName", CsvSchema.ColumnType.STRING)
.addColumn("age", CsvSchema.ColumnType.NUMBER)
.build().withHeader();
// Create schema aware map module
SimpleModule csvMapModule = new SimpleModule();
csvMapModule.addValueInstantiator(CsvMap.class, new CsvMapInstantiator(schema));
// register map
CsvMapper csvMapper = new CsvMapper();
csvMapper.registerModule(csvMapModule);
// get reader for CsvMap + schema
ObjectReader objectReaderWithSchema = csvMapper
.readerWithSchemaFor(CsvMap.class)
.with(schema);
MappingIterator<CsvMap> mappingIterator = objectReaderWithSchema.readValues(csvFile);
while (mappingIterator.hasNext()) {
CsvMap entryMap = mappingIterator.next();
Number age = (Number) entryMap.get("age");
System.out.println(age + " (" + age.getClass() + ")");
}
}
}
以下CSV
有效负载的代码:
firstName,lastName,age
John,Doe,21
Error,Name,-10.1
打印:
21 (class java.lang.Long)
-10.1 (class java.lang.Double)
这看起来像是骇客,但我想展示这种可能性。