我写了一个简单的测试程序来插入一行。与普通HBase Put示例程序的唯一不同之处在于,使用时间戳创建了Put实例及其KeyValue实例。
预期的行为是插入一行。但是,在我的HBase环境中,没有插入任何行。
以下是我的测试计划。
import java.io.*;
import java.util.*;
import org.apache.hadoop.conf.*;
import org.apache.hadoop.hbase.*;
import org.apache.hadoop.hbase.client.*;
import org.apache.hadoop.hbase.util.*;
public class Test
{
// Names of table, family, qualifier and row ID.
private static final byte[] TABLE = Bytes.toBytes("test-table");
private static final byte[] FAMILY = Bytes.toBytes("test-family");
private static final byte[] QUALIFIER = Bytes.toBytes("test-qualifier");
private static final byte[] ROWID = Bytes.toBytes("test-rowid");
/**
* The entry point of this program.
*
* <p>
* This program assumes that there already exists an HBase
* table named "test-table" with a column family named
* "test-family". To create an HBase table satisfying these
* conditions, type the following at the hbase shell prompt.
* </p>
*
* <pre>
* hbase> create 'test-table', 'test-family'
* </pre>
*
* <p>
* This program inserts a row whose row ID is "test-rowid"
* with a column named "test-family:test-qualifier". The
* value of the column is the string expression of
* <code>new Date()</code>.
* </p>
*/
public static void main(String[] args) throws Exception
{
// Get the table.
Configuration conf = HBaseConfiguration.create();
HTable table = new HTable(conf, TABLE);
// Prepare data to put.
byte[] value = Bytes.toBytes(new Date().toString());
Put put = new Put(ROWID);
put.add(FAMILY, QUALIFIER, value);
// Clone Put with a timestamp.
put = clone(put, 10);
// Put the data.
table.put(put);
// Read back the data.
Get get = new Get(ROWID);
Result result = table.get(get);
// Dump the read data.
System.out.println("DATA = " + result.toString());
}
/**
* Clone the given Put instance with the given timestamp.
*/
private static Put clone(Put a, long timestamp) throws IOException
{
// Create a Put instance with the specified timestamp.
Put b = new Put(a.getRow(), timestamp);
Map<byte[], List<KeyValue>> kvs = a.getFamilyMap();
// Copy KeyValue's from the source Put (a) to
// the cloned Put (b). Note the given timestamp
// is used for each new KeyValue instance.
for (List<KeyValue> kvl : kvs.values())
{
for (KeyValue kv : kvl)
{
b.add(new KeyValue(
kv.getRow(),
kv.getFamily(),
kv.getQualifier(),
timestamp,
kv.getValue()));
}
}
return b;
}
}
此程序生成的控制台输出如下:
DATA = keyvalues=NONE
&#34;扫描&#34;在hbase shell中说&#34; 0行&#34;。
hbase(main):011:0> scan 'test-table'
ROW COLUMN+CELL
0 row(s) in 0.0080 seconds
注释掉代码行以克隆Put实例,如下所示
// Clone Put with a timestamp.
//put = clone(put, 10);
也就是说,使用没有timestamp参数创建的Put实例会改变程序的行为。在这种情况下,控制台输出显示插入的值
DATA = keyvalues={test-rowid/test-family:test-qualifier/1344594210281/Put/vlen=28}
和&#34;扫描&#34;显示插入的行。
hbase(main):012:0> scan 'test-table'
ROW COLUMN+CELL
test-rowid column=test-family:test-qualifier, timestamp=1344594210281, value=Fri Aug 10 19:23:30 JST 2012
1 row(s) in 0.0110 seconds
使用我的测试程序中使用的时间戳来克隆Put实例的逻辑是一个已知可行的开源项目的摘录。所以,我想这个问题的根本原因存在于我的HBase环境中,但我不知道。我的调查可能不够,但我还没有看到HBase日志中的任何错误。
有人可以告诉我这个问题吗?
答案 0 :(得分:0)
时间戳列族和列名构成组合键。这里的时间戳是UNIX时间戳。
答案 1 :(得分:0)
KeyValueTestUtil.create可以创建KeyValue对象,并将其设置为Put
答案 2 :(得分:0)
我不确定这会有所帮助,但是 - 我以前去过那里,所以,只是试图帮助你调试你的逻辑。
我要确定的第一件事是你之前从未删除过该行。 H-Base Delete的工作方式是将墓碑标记放在当前时间戳的(Row / KeyValue)中的位置(除非您指定了另一个)。 Soooo - 如果你在删除后拍了一个Put,并且没有发生重大压缩,你将永远不会看到你的Put ...这是一个线程:https://issues.apache.org/jira/browse/HBASE-5241 - 你可以尝试执行一个“ major_compact“来自该表上的H-Base shell,然后执行另一个测试周期。
..这是我的第一个猜测...它是一个测试场景的内联:放在当前时间,执行扫描,断言put操作正常(是的,它确实 - 是啊!),然后,删除当前数据重置pallete,执行下一个Put用较小的时间戳 - 执行扫描 - 刮擦头......
分手思考 - Get操作始终返回KeyValue的最新版本。所以...如果你在测试中执行时间戳为T1的Put,然后你执行时间戳为T2的Put,并且T2&lt; T1,然后,当您执行Get操作时,您将获得与T1关联的值。这可能最初是违反直觉的,但是 - 这一切都很好:)
希望有一些东西可以帮助你的旅程......