Hive 安装依赖 Hadoop 的集群,它是运行在 Hadoop的基础上。 所以在安装 Hive 之前,保证 Hadoop 集群能够成功运行。

同时,比如在hadoop集群中,hive的安装可以安装在任一一个节点上。当然,也可以安装在集群之外,取名为client。只需要ssh免密码通信即可。

本文对在centos7下安装hive 进行简单说明。

安装前的前置服务

安装步骤

  1. 去官网下载 hive 的说明和安装包. 下载 这里提供了各版本的 hive. 主要hive版本要和hadoop 版本匹配

  2. 下载 mysql-connector-java

  3. 解压 hive-bin 包

  4. 添加环境变量

    export HIVE_HOME=/opt/hive
    export PATH=$HIVE_HOME/bin:$PATH
    
  5. configuration.md 中的配置,修改文件 $HIVE_HOME/conf/hive-site.xml

    set javax.jdo.option.ConnectionUserName=hive
    set javax.jdo.option.ConnectionPassword=hive
    set javax.jdo.option.ConnectionURL=jdbc:mysql://master:3306/hive?characterEncoding=UTF-8&useSSL=false
    set javax.jdo.option.ConnectionDriverName=com.mysql.jdbc.Driver
    
    set hive.metastore.uris=thrift://master:9083
    
  6. 解压 mysql-connector-java 包,将里边的 mysql-connector-java-*-bin.jar 包移动到 $HIVE_HOME/lib 中

  7. 删除 $HIVE_HOME/lib/log4j-slf4j-impl-*.jar 避免和hadoop 的 jar包冲突

  8. 执行 schematool -dbType mysql -initSchema 为hive初始化元数据库。

  9. 执行 hive 执行 cli 程序

  10. 可以执行 hiveserver2 启动 hiveserver2 服务器, web 访问

  11. 执行 hdfs dfs -mkdir -p /user/hive/warehouse 创建hive 所使用的 warehouse 路径, hive 建立的内部表都会存放到该路径下

  12. 也可以使用 beeline 直接连接 hiveserver2 访问

    beeline jdbc:hive2://master:10000