您的位置 首页 java

0097-如何使用java代码通过JDBC连接Impala(附Github源码)

1.文档编写目的


访问Impala的方式很多(如:impala-shell、ODBC、JDBC、Beeline),也可以通过Hue的来访问。关于Beeline方式连接Impala可以参考前面的《

如何使用Beeline连接Impala

》,本篇文章主要讲述如何使用JAVA代码通过JDBC的方式连接Kerberos和非Kerberos环境下的Impala。

  • 内容概述

1.环境准备

2.非Kerberos及Kerberos环境连接示例

  • 测试环境

1.Kerberos集群CDH5.11.2,OS为Redhat7.2

2.非Kerberos集群CDH5.13,OS为CentOS6.5

3.Impala JDBC驱动版本2.5.41.1061

  • 前置条件

1.Kerberos和非Kerberos集群Impala服务正常

2.环境准备


1.下载Impala JDBC驱动包

 

2.创建Java工程jdbcdemo

创建工程时注意加入Hadoop的依赖包

<dependency>
 <groupId>org.apache.hadoop</groupId>
 <artifactId>hadoop-client</artifactId>
 <version>2.6.5</version>
</dependency>
 

将下载的Impala驱动包添加到jdbcdemo工程lib目录下,并加载到环境变量

0097-如何使用java代码通过JDBC连接Impala(附Github源码)

3.非Kerberos环境


1.示例代码

private  static  String JDBC_DRIVER = "com.cloudera.impala.jdbc41.Driver";
private static String CONNECTION_URL ="jdbc:impala://54.255.237.128:21050/";
static {
 try {
 Class.forName(JDBC_DRIVER);
 } catch (Exception e) {
 e.printStackTrace();
 }
}
public static void main(String[] args) {
 Connection connection = null;
 ResultSet rs = null;
 PreparedStatement ps = null;
 try {
 connection = DriverManager.getConnection(CONNECTION_URL);
 ps = connection.prepareStatement("select * from test_table");
 rs = ps.executeQuery();
 while (rs.next()) {
 System.out.println(rs.getInt(1) + "-------" + rs.getString(2));
 }
 } catch (Exception e) {
 e.printStackTrace();
 } finally {
 JDBCUtils.disconnect(connection, rs, ps);
 }
}
 
0097-如何使用java代码通过JDBC连接Impala(附Github源码)

2.示例代码运行

0097-如何使用java代码通过JDBC连接Impala(附Github源码)

4.Kerberos环境


在Kerberos环境下的Impala需要准备Kerberos的krb5.conf文件及keytab文件。

注意:Fayson的测试环境是AWS,所以将kdc和Impala Daemon服务的IP地址修改为外网地址。JDBC URL后Kerberos信息是连接的Impala Daemon服务对应Prinical信息。

  • krb5.conf配置,直接将集群的krb5.conf文件拷贝至本地开发环境下
#  configuration  snippets may be placed in this directory as well
includedir /etc/krb5.conf.d/
[logging]
 default = FILE:/ var /log/krb5libs.log
 kdc = FILE:/var/log/krb5kdc.log
 admin_server = FILE:/var/log/kadmind.log
[libdefaults]
 dns_lookup_realm = false
 ticket_lifetime = 24h
 renew_lifetime = 7d
 forwardable = true
 rdns = false
 default_realm = CLOUDERA.COM
 #default_ccache_name = KEYRING:persistent:%{uid}
[realms]
 CLOUDERA.COM = {
 kdc = 54.179.148.25
 admin_server = 54.179.148.25
 }
 

keytab文件生成

[ec2-user@ip-172-31-22-86 ~]$ sudo kadmin.local
Authenticating as principal hive/admin@CLOUDERA.COM with password.
kadmin.local: xst -norandkey -k fayson.keytab fayson@CLOUDERA.COM 
 

1.示例代码

private static String JDBC_DRIVER = "com.cloudera.impala.jdbc41.Driver";
private static String CONNECTION_URL = "jdbc:impala://13.229.60.149:21050/default;AuthMech=1;KrbRealm=CLOUDERA.COM;KrbHostFQDN=ip-172-31-26-102.ap-southeast-1.compute.internal;KrbServiceName=impala";
static {
 try {
 Class.forName(JDBC_DRIVER);
 } catch (ClassNotFoundException e) {
 e.printStackTrace();
 }
}
public static void main(String[] args) {
 //登录Kerberos账号
 try {
 System.setProperty("java.security.krb5.conf", "/Volumes/Transcend/keytab/krb5.conf");
 Configuration configuration = new Configuration();
 configuration.set("hadoop.security.authentication" , "Kerberos");
 UserGroupInformation. setConfiguration(configuration);
 UserGroupInformation.loginUserFromKeytab("fayson@CLOUDERA.COM", "/Volumes/Transcend/keytab/fayson.keytab");
 System.out.println(UserGroupInformation.getCurrentUser() + "------" + UserGroupInformation.getLoginUser());
 UserGroupInformation loginUser = UserGroupInformation.getLoginUser();
 loginUser.doAs(new PrivilegedAction<Object>(){
 public Object run() {
 Connection connection = null;
 ResultSet rs = null;
 PreparedStatement ps = null;
 try {
 Class.forName(JDBC_DRIVER);
 connection = DriverManager.getConnection(CONNECTION_URL);
 ps = connection.prepareStatement("select * from test_table");
 rs = ps.executeQuery();
 rs = ps.executeQuery();
 while (rs.next()) {
 System.out.println(rs.getInt(1));
 }
 } catch (Exception e) {
 e.printStackTrace();
 } finally {
 JDBCUtils.disconnect(connection, rs, ps);
 }
 return null;
 }
 });
 } catch (IOException e) {
 e.printStackTrace();
 }
}
 
0097-如何使用java代码通过JDBC连接Impala(附Github源码)

具体JDBC的URL参数说明参考:

2.示例代码运行

0097-如何使用java代码通过JDBC连接Impala(附Github源码)

GitHub源码地址:

为天地立心,为生民立命,为往圣继绝学,为万世开太平。

温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。


您可能还想看

安装


CENTOS6.5安装CDH5.12.1(一)

CENTOS6.5安装CDH5.12.1(二)

CENTOS7.2安装CDH5.10和Kudu1.2(一)

CENTOS7.2安装CDH5.10和Kudu1.2(二)

如何在CDH中安装Kudu&Spark2&Kafka

如何升级Cloudera Manager和CDH

如何卸载CDH(附一键卸载github源码)

如何迁移Cloudera Manager节点

如何在Windows Server2008搭建DNS服务并配置泛域名解析

安全


如何在CDH集群启用Kerberos

如何在Hue中使用Sentry

如何在CDH启用Kerberos的情况下安装及使用Sentry(一)

如何在CDH启用Kerberos的情况下安装及使用Sentry(二)

如何在CDH未启用认证的情况下安装及使用Sentry

如何使用Sentry管理Hive外部表权限

如何使用Sentry管理Hive外部表(补充)

如何在Kerberos与非Kerberos的CDH集群BDR不可用时复制数据

Windows Kerberos客户端配置并访问CDH

数据科学


如何在CDSW中使用R绘制直方图

如何使用Python Impyla客户端连接Hive和Impala

如何在CDH集群安装Anaconda&搭建Python私有源

如何使用CDSW在CDH中分布式运行所有R代码

如何使用CDSW在CDH集群通过sparklyr提交R的Spark作业

如何使用R连接Hive与Impala

如何在Redhat中安装R的包及搭建R的私有源

如何在Redhat中配置R环境

什么是sparklyr

其他


CDH网络要求(Lenovo参考架构)

大数据售前的中年危机

如何实现CDH元数据库MySQL的主备

如何在CDH中使用HPLSQL实现存储过程

如何在Hive&Impala中使用UDF

Hive多分隔符支持示例


推荐关注Hadoop实操,第一时间,分享更多Hadoop干货,欢迎转发和分享。

原创文章,欢迎转载,转载请注明:转载自微信公众号Hadoop实操

文章来源:智云一二三科技

文章标题:0097-如何使用java代码通过JDBC连接Impala(附Github源码)

文章地址:https://www.zhihuclub.com/187266.shtml

关于作者: 智云科技

热门文章

网站地图