Hive查询结果存储

简介

在Hive中进行数据检索并将检索结果存储以供下一步分析是比较常见的操作.

常见的存储结果的路径分为以下几种:

  1. Hive
  2. HDFS
  3. Local Directory 本地路径

可能最常用的还是本地路径.

通过Hive查询的文章参考

通过Hive客户端进行查询, 结果存储在本地路径文件中

示例

  • 单条查询
>>> hive -e "select user, login_timestamp from user_login" > /tmp/out.txt
  • 多条查询
>>> hive -f file.sql > /tmp/out.txt

说明

这种方法是调用本地的Hive客户端进行查询, 并且将查询结果输出到本地路径下的文件中. 该方法更多利用的是Bash.

HQL

保存结果到本地路径

hive > insert overwrite local directory "/tmp/out/"
       > select user, login_time from user_login ;

保存结果到HDFS路径

hive > insert overwrite directory "/tmp/out/"
       > row format delimited fields terminated by "\t"
       > select user, login_time from user_login;

保存结果至Hive表中

  • 覆盖原表中数据
hive > insert overwrite table query_result
       > select user, login_time from user_login;
  • 向原表追加数据
hive > insert into table query_result
       > select * from query_result;

References

几种保存Hive查询结果的方法

发表评论

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据