我通过Cloudera Manager安装了HDFS,Hive,Impala,Kudu等,经理表明他们运行良好。但是,当我尝试通过Python客户端在Kudu中创建一个表时,它总是超过超时。在Kudu Web界面中,我发现总是会创建和删除多个平板电脑。我也尝试通过impala-shell创建表,事情是一样的。结果,生成了大量日志文件并占用了磁盘的大量可用空间。 由于集群的性能不是很好,这有关系吗? 创建表的代码:
import kudu
from kudu.client import Partitioning
import time
client = kudu.connect(host='bcmi-node1', port=7051)
# client.delete_table("labels")
builder = kudu.schema_builder()
builder.add_column('key').type(kudu.int64).nullable(False).primary_key()
builder.add_column('image').type(kudu.string).nullable(False)
builder.add_column('xmin').type(kudu.int32).nullable(False)
builder.add_column('ymin').type(kudu.int32).nullable(False)
builder.add_column('xmax').type(kudu.int32).nullable(False)
builder.add_column('ymax').type(kudu.int32).nullable(False)
builder.add_column('label').type(kudu.string).nullable(False)
schema = builder.build()
partitioning = Partitioning().add_hash_partitions(column_names=['key'],num_buckets=3)
client.create_table('labels', schema, partitioning)