附加Twitter流/公共数据集作为YCSB工作负载的输入

时间:2015-12-23 20:56:53

标签: twitter stream dataset benchmarking ycsb

YCSB的工作负载使用自动生成的数据。有没有办法将Twitter或其他服务的公共数据集作为工作负载的输入?我需要使用这些数据集的因果关系方面。 (例如,{id,tweet,parent-id ..}

1 个答案:

答案 0 :(得分:0)

你不能在香草YCSB中,但你可以使用KV-replay分叉。工作负载(跟踪)需要修改为其输入格式,但在Python或bash中应该很容易。