hive实战1

发布时间:2025-01-04 09:38

项目实战能提升编程实战经验 #生活知识# #生活经验# #编程#

前置条件:

Hadoop(HDFS)已安装

2、在/etc/profile 或者~/.bashrc中配置hive环境变量:

export HIVE_HOME=hive安装路径

export PATH=$PATH:$HIVE_HOME/bin:$HIVE_HOME/conf

3、启用环境变量,即使环境变量生效:

source /etc/profile

4、创建配置文件

[root@hadoop01 conf]# cd apache-hive-1.0.0-bin/conf

[root@hadoop01 conf]# cp hive-default.xml.template hive-site.xml

[root@hadoop01 conf]# cp hive-env.sh.template hive-env.sh

[root@hadoop01 conf]# cp hive-exec-log4j.properties.template hive-execlog4j.

properties

[root@hadoop01 conf]# cp hive-log4j.properties.template hive-log4j.properties

5、修改配置文件$HIVE_HOME/conf/hive-env.sh:

export HADOOP_HOME=hadoop安装路径

export HIVE_CONF_DIR=hive安装路径/conf

6、修改配置文件$HIVE_HOME/conf/hive-site.xml.:

hive.metastore.warehouse.dir:默认为 /user/hive/warehouse. ( HDFS上的路径)。可以保持不变。

7、设置元数据数据库

默认情况下,hive使用嵌入式的derby数据库存储元数据。支持postgre SQL、或Mysql数据库来存储元数据。如果要更换存储元数据的数据库,需要配置以下参数值:

javax.jdo.option.ConnectionURL // 数据库URL

javax.jdo.option.ConnectionDriverName // JDBC 驱动名称

javax.jdo.option.ConnectionUserName // 数据库用户名

javax.jdo.option.ConnectionPassword // 数据库密码

下面是使用mysql来存储元数据的配置信息:

<configuration>

<property>

<name>javax.jdo.option.ConnectionURL</name>

<value>jdbc:mysql://hadoop01:3306/hive?createDatabaseIfNotExist=true</value>

<description>JDBC connect string for a JDBC metastore</description>

</property>

<property>

<name>javax.jdo.option.ConnectionDriverName</name>

<value>com.mysql.jdbc.Driver</value>

<description>Driver class name for a JDBC metastore</description>

</property>

<property>

<name>javax.jdo.option.ConnectionUserName</name>

<value>root</value>

<description>username to use against metastore database</description>

</property>

<property>

<name>javax.jdo.option.ConnectionPassword</name>

<value>******</value>

<description>password to use against metastore database</description>

</property>

</configuration>

确保 MySQL JDBC 驱动存在于 $HIVE_HOME/lib目录下。

8、在hdfs上创建warehouse文件夹,并授权

[root@hadoop01 conf]# hdfs dfs –mkdir /tmp

[root@hadoop01 conf]# hdfs dfs –mkdir /user/hive/warehouse

[root@hadoop01 conf]# hdfs dfs -chmod g+w /tmp

[root@hadoop01 conf]# hdfs dfs -chmod g+w /user/hive/warehouse

9、在终端输入hive命令,如果进入hive命令行界面,说明hive安装成功。

10、 新的命令行工具beeline: 基于SQLLine CLI的JDBC客户端。关于SQLLine的的知识,可以参考这个网站:http://sqlline.sourceforge.net/#manual。

Beeline工作模式有两种 ,即本地嵌入模式和远程模式。本地嵌入模式情况下,它返回一个嵌入式的Hive(类似于Hive CLI)。而远程模式则是通过Thrift协议与某个单独的HiveServer2进程进行连接通信。

启动方式如下:

–Beeline 要与HiveServer2配合使用。

–启动HiverServer2

./hiveserver2

–启动Beeline

./beeline

--连接beeline

–beeline> !connect jdbc:hive2://localhost:10000

–默认用户名、密码不验证

配置文件hive-default.xml中的hive.server2.authentication默认为NONE

11、 beeline命令 的使用方式: !<SQLLine command> --comments ; (感叹号开始)

如 !quit !connect

改变输出格式:在启动beeline时增加参数 ./beeline --outputformat=vertical

注意区分beeline命令和HCatalog sql语句:

!quit !connect ----beeline命令

show tables; select * from table2;---HCatalog DDL sql语句 (分号结尾,注释使用双横线 --)

网址:hive实战1 https://www.yuejiaxmz.com/news/view/640920

相关内容

Hive 性能优化 9 大技巧
hive拒绝访问Connection refused (state=08S01,code=0)
Hive数据倾斜及解决方法
一文搞懂Hive存储格式及压缩格式,太清晰了!
Hive加载数据报相关权限问题
不要再说Hive跑得慢啦,这几招调优技巧一级棒
【Hive】学习与优化4(含常用面试题)
电信运营商家庭信息化发展战略研究报告2013.pdf
任务管理模块
大数据在天气预报中的创新与改进1.背景介绍 天气预报是一项对人类生活和经济活动至关重要的科学技术。随着全球变化和人口增长

随便看看