Hive 安装依赖 Hadoop 的集群,它是运行在 Hadoop的基础上。 所以在安装 Hive 之前,保证 Hadoop 集群能够成功运行。
同时,比如在hadoop集群中,hive的安装可以安装在任一一个节点上。当然,也可以安装在集群之外,取名为client。只需要ssh免密码通信即可。
本文对在centos7下安装hive 进行简单说明。
去官网下载 hive 的说明和安装包. 下载 这里提供了各版本的 hive. 主要hive版本要和hadoop 版本匹配
下载 mysql-connector-java 包
解压 hive-bin 包
添加环境变量
export HIVE_HOME=/opt/hive
export PATH=$HIVE_HOME/bin:$PATH
按 configuration.md 中的配置,修改文件 $HIVE_HOME/conf/hive-site.xml
set javax.jdo.option.ConnectionUserName=hive
set javax.jdo.option.ConnectionPassword=hive
set javax.jdo.option.ConnectionURL=jdbc:mysql://master:3306/hive?characterEncoding=UTF-8&useSSL=false
set javax.jdo.option.ConnectionDriverName=com.mysql.jdbc.Driver
set hive.metastore.uris=thrift://master:9083
解压 mysql-connector-java 包,将里边的 mysql-connector-java-*-bin.jar
包移动到 $HIVE_HOME/lib 中
删除 $HIVE_HOME/lib/log4j-slf4j-impl-*.jar
避免和hadoop 的 jar包冲突
执行 schematool -dbType mysql -initSchema
为hive初始化元数据库。
执行 hive 执行 cli 程序
可以执行 hiveserver2 启动 hiveserver2 服务器, web 访问
执行 hdfs dfs -mkdir -p /user/hive/warehouse
创建hive 所使用的 warehouse 路径, hive 建立的内部表都会存放到该路径下
也可以使用 beeline 直接连接 hiveserver2 访问
beeline jdbc:hive2://master:10000