hive相关 - 程序员宅基地

Hive组件相关知识点总结

在搭建数据仓库时，Hive组件在其中发挥了非常关键的作用，我们知道Hive是一个基于Hadoop的重要数据仓库工具，但具体如何应用则需要我们进一步进行探索。hive是基于Hadoop的一个数据仓库工具，用来进行数据提取、转化...

Hive 数据同步ClickHouse

把所有数据分析相关的日志数据存储至ClickHouse这个优秀的数据仓库之中，当前日数据量达到了300亿。需求：按条件筛选Hive表中的数据同步到ClickHouse中方法一：按照ClickHouse 官方文档提供的方法，在ClickHouse 中...

Hive调优

标签： hive hadoop 数据仓库

Hive调优总结:1. 改硬件.2. 开启或者增大某些设置(配置). 负载均衡, 严格模式(禁用低效SQL), 动态分区数...3. 关闭或者减小某些设置(配置). 严格模式(动态分区), 推测执行...4. 减少IO传输. Input(输入)/Output(输出...

hive创建hbase外部关联表实例

标签： hive hbase hadoop

在cdh6.3.2已经做好hbase和hive相关配置，这里不阐述。要创建上述的表结构，你需要先在HBase中创建相应的表，然后在Hive中创建一个EXTERNAL TABLE来映射到这个HBase表。

通过hive元数据表获取hive分区表的相关信息

标签： hive sql hadoop

通过hive元数据表获取hive分区表的元数据信息通过hive元数据表获取hive分区表的元数据信息项目中需要获取hive所有分区表的分区信息并显示到页面如图方案：通过JDBC连接hive源数据库，sql语句实现编写sql语句：...

SparkSQL与Hive交互

标签： hive 大数据 hadoop

SparkSQL与Hive交互

Hadoop集群的使用与HDFS文件系统，Hive,MySQL与Apache Hive

标签： hadoop hdfs 大数据

4、Apache Hive是一款分布式SQL计算的工具，其主要功是:将SQL语句翻译成MapReduce程序运行，可以用IntelliJ IDEA，PyCharm等进行数据库的编写与导入更加简洁。安装好hadoop环境之后，可以执行hdfs相关的shel命令对...

主要介绍大数据数据仓库的理论知识，hadoop和hive相关知识

标签： hadoop 大数据数据仓库 hive

主要介绍大数据数据仓库的理论知识，hadoop和hive相关知识

一文带你了解Hive【详细介绍】Hive与传统数据库有什么区别？

标签： hive big data hadoop

1 什么是Hive？首先给大家介绍一下什么是Hive。 Hive是Facebook为了解决海量数据的统计分析，而开发的基于Hadoop的一个数据分析工具（也就证明了Hive没有存储数据的能力，它只有使用数据的能力），而且是将结构化的...

Hive -- Hive3.1.3在 hadoop3.2.1的部署安装

标签：大数据 hadoop Hive

Hive 3.1.3

Hive基础

标签： hive hadoop 数据仓库

Hive是一个SQL转化转化工具，将SQL的计算转为MapReduce的计算，让开发人员更加方便进行大数据开发。如果使用多个客户端进行访问,就需要有多个Hiveserver服务,此时会启动多个Metastore。2、不需要单独配置metastore ...

【Hive上篇：一篇文章带你使用Hive！深入了解Hive！学会Hive！】

标签： hive hadoop 数据仓库

什么是Hive？Hive是基于Hadoop的一个数据仓库工具，用于进行数据提取、转换和加载（ETL）。它可以将结构化的数据文件映射为一张数据库表，并提供类似SQL的查询语言（HiveQL），使用户能够使用SQL语句来查询、汇总和...

hive mysql初始_hive mysql 初始化

标签： hive mysql初始

Hive 简介Hive 是一个基于 hadoop 的开源数据仓库工具，用于存储和处理海量结构化数据。它把海量数据存储于 hadoop 文件系统，而不是数据库，但提供了一套类数据库的数据存储和处理机制，并采用 HQL (类 SQL )语言对...

idea-cdh-hive-lib.zip

标签： hive lib cdh idea

idea中使用的apache hive的cdh版本的所有驱动jar zookeeper-jute-3.5.9.jar zookeeper-3.5.9.jar hive-jdbc-1.1.0-cdh5.12.1-standalone.jar curator-framework-4.2.0.jar ...高可用需要添加curator相关jar

33、Flink之hive介绍与简单示例

标签： flink 流批一体化 flink sql flink hive

Flink与hive的介绍及简单示例

大数据处理相关技术学习之路-相关技术包括离线处理，实时处理，OLAP等，如hadoop、spark、flink、hive、hba

标签： hadoop spark 大数据 flink hive

相关技术包括离线处理，实时处理，OLAP等，如hadoop、spark、flink、hive、hbase、oozie...以及大数据项目，如用户画像、数据仓库等 Hadoop是一个由Apache基金会所开发的分布式系统基础架构。 Spark是基于内存计算...

Hive的安装

标签： hadoop mysql hive

相关软件版本如下: 备注：64位软件版本 Linux Ubuntu 18 Hadoop 2.7.7 MySQL 5.7 MySQL驱动 5.1.47 Hive 2.3.7 DBeaver 7.1.0 检查Hadoop环境（1）查看Hadoop版本号，命令如下: hadoop ...

Hive的安装部署

标签： hive 大数据 hadoop

Hive的安装部署

【Hive下篇：超干货文章带你深入了解Hive！hive分区分桶！学习hive原理！】

标签： hive hadoop 大数据

【Hive下篇：超干货文章带你深入了解Hive！hive分区分桶！学习hive原理！】表的分区，分桶，数据的读取和写入

SpringBoot连接Hive问题

标签： hive hadoop 数据仓库

在网上搜索了好些文章，基本上都是说hive-jdbc的版本和服务器上的hive版本不一致所致，通过断点跟踪，确实是由于服务器端返回这条错误信息，先后更换了好几个hive-jdbc版本，都无法解决。业务上需要在一个SpringBoot...

hive主要知识点

标签：数据仓库 hive 数据库

1、数据仓库数据仓库是一个面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合，用于对管理决策过程的支持。 2、数据库和数据仓库数据库：是一种逻辑概念，用来存放数据的仓库。...

Hive教程（07）- Hive自定义用户名密码验证(已开源）

标签： hive hadoop big data

文章目录01 引言02 打包鉴权jar2.1 步骤1：新建项目2.2 步骤2：编写鉴权代码2.2 步骤3：打包03 配置鉴权3.1 步骤一：上传jar包3.2 步骤二：配置hite-site.xml3.3 步骤三：配置user.password.conf3.4 步骤四：配置...

hive-set设置总结

标签： hive

Hive相关的配置属性总结set hive.cli.print.current.db=true;在cli hive提示符后显示当前数据库。set hive.cli.print.header=true;显示表头。select时会显示对应字段。set hive.mapred.mode=strict;防止笛卡儿积的...