跳至主要內容
Hive与Spark问题解答

hive高频问题和解答

一、什么是数据仓库:

  • 是存储数据的仓库,
  • 不生产数据,也不消费数据。
  • 有4大特征:1-面向主题,2-集成性,3-非易失性,4-时变性

二、建模的方法

  • 有【三范式建模】和【维度建模】,大数据数仓用维度建模。
    • 三范式建模:尽量不冗余,表数量较多。更适合业务系统, OLTP
    • 维度建模: 形成少量宽表,宽表内允许大量冗余,更适合离线数仓,OLAP

Znyoung大约 19 分钟大数据面试HiveSpark
Hive

资料

数据仓库介绍

数据仓库的基本概念

数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库顾名思义,是一个很大的数据存储集合,出于企业的分析性报告和决策支持目的而创建,对多样的业务数据进行筛选与整合。它为企业提供一定的BI(商业智能)能力,指导业务流程改进、监视时间、成本、质量以及控制。
数据仓库的输入方是各种各样的数据源,最终的输出用于企业的数据分析、数据挖掘、数据报表等方向。

image.png
image.png

Znyoung大约 54 分钟大数据Hive