Hbase 简明教程
HBase - Create Data
Inserting Data using HBase Shell
本章演示如何在 HBase 表中创建数据。要创建 HBase 表中的数据,请使用以下命令和方法:
-
put command,
-
Put 类的 add() 方法;和
-
HTable 类的 put() 方法。
例如,我们要在 HBase 中创建以下表。
使用 put 命令,你可以向表中插入行。其语法如下:
put ’<table name>’,’row1’,’<colfamily:colname>’,’<value>’
Inserting the First Row
让我们按如下所示向 emp 表中插入第一行值。
hbase(main):005:0> put 'emp','1','personal data:name','raju'
0 row(s) in 0.6600 seconds
hbase(main):006:0> put 'emp','1','personal data:city','hyderabad'
0 row(s) in 0.0410 seconds
hbase(main):007:0> put 'emp','1','professional
data:designation','manager'
0 row(s) in 0.0240 seconds
hbase(main):007:0> put 'emp','1','professional data:salary','50000'
0 row(s) in 0.0240 seconds
以相同的方式使用 put 命令插入其余行。如果你插入整个表,你将获得以下输出。
hbase(main):022:0> scan 'emp'
ROW COLUMN+CELL
1 column=personal data:city, timestamp=1417524216501, value=hyderabad
1 column=personal data:name, timestamp=1417524185058, value=ramu
1 column=professional data:designation, timestamp=1417524232601,
value=manager
1 column=professional data:salary, timestamp=1417524244109, value=50000
2 column=personal data:city, timestamp=1417524574905, value=chennai
2 column=personal data:name, timestamp=1417524556125, value=ravi
2 column=professional data:designation, timestamp=1417524592204,
value=sr:engg
2 column=professional data:salary, timestamp=1417524604221, value=30000
3 column=personal data:city, timestamp=1417524681780, value=delhi
3 column=personal data:name, timestamp=1417524672067, value=rajesh
3 column=professional data:designation, timestamp=1417524693187,
value=jr:engg
3 column=professional data:salary, timestamp=1417524702514,
value=25000
Inserting Data Using Java API
您可以使用 Put 类的 add() 方法向 HBase 插入数据。您可以使用 HTable 类的 put() 方法进行保存。这些类属于 org.apache.hadoop.hbase.client 包。以下是创建 HBase 表中的数据的步骤
Step 1:Instantiate the Configuration Class
Configuration 类将 HBase 配置文件添加到其对象中。您可以使用 HbaseConfiguration 类的 create() 方法创建一个配置对象,如下所示。
Configuration conf = HbaseConfiguration.create();
Step 2:Instantiate the HTable Class
您有一个名为 HTable 的类,它是 HBase 中 Table 的实现。该类用于与单个 HBase 表进行通信。在实例化该类时,它接受配置对象和表名作为参数。您可以如下所示实例化 HTable 类。
HTable hTable = new HTable(conf, tableName);
Step 3: Instantiate the PutClass
若要将数据插入 HBase 表,请使用 add() 方法及其变体。该方法属于 Put ,因此实例化 put 类。该类需要以字符串格式的你要向其插入数据的行名称。您可以如下所示实例化 Put 类。
Put p = new Put(Bytes.toBytes("row1"));
Step 4: Insert Data
使用 Put 类的 add() 方法插入数据。它需要分别表示列族、列限定符(列名)和要插入的值的 3 个字节数组。使用 add() 方法将数据插入 HBase 表,如下所示。
p.add(Bytes.toBytes("coloumn family "), Bytes.toBytes("column
name"),Bytes.toBytes("value"));
Step 6: Close the HTable Instance
在 HBase 表中创建数据后,使用 close() 方法关闭 HTable 实例,如下所示。
hTable.close();
以下是创建 HBase 表中数据的完整程序。
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.client.HTable;
import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.util.Bytes;
public class InsertData{
public static void main(String[] args) throws IOException {
// Instantiating Configuration class
Configuration config = HBaseConfiguration.create();
// Instantiating HTable class
HTable hTable = new HTable(config, "emp");
// Instantiating Put class
// accepts a row name.
Put p = new Put(Bytes.toBytes("row1"));
// adding values using add() method
// accepts column family name, qualifier/row name ,value
p.add(Bytes.toBytes("personal"),
Bytes.toBytes("name"),Bytes.toBytes("raju"));
p.add(Bytes.toBytes("personal"),
Bytes.toBytes("city"),Bytes.toBytes("hyderabad"));
p.add(Bytes.toBytes("professional"),Bytes.toBytes("designation"),
Bytes.toBytes("manager"));
p.add(Bytes.toBytes("professional"),Bytes.toBytes("salary"),
Bytes.toBytes("50000"));
// Saving the put Instance to the HTable.
hTable.put(p);
System.out.println("data inserted");
// closing HTable
hTable.close();
}
}
编译并执行上述程序,如下所示:
$javac InsertData.java
$java InsertData
输出应如下所示:
data inserted