跳至主要內容
SQL加强

SQL强化

SQL执行顺序

--举例:
select 
       a.sex,
       b.city,
       count(1) as cnt,
       sum(salary) as sum1
from table1 a
join table2 b on a.id=b.id
where a.name=b.name
group by a.sex,b.city
having cnt>=2
order by a.sex,b.city
limit 10
--或者是
select distinct
       a.sex,
       b.city,
       a.age
from table1 a
join table2 b on a.id=b.id
where a.name=b.name
order by a.sex,b.city
limit 10

Znyoung大约 39 分钟大数据面试SQL
Hive与Spark问题解答

hive高频问题和解答

一、什么是数据仓库:

  • 是存储数据的仓库,
  • 不生产数据,也不消费数据。
  • 有4大特征:1-面向主题,2-集成性,3-非易失性,4-时变性

二、建模的方法

  • 有【三范式建模】和【维度建模】,大数据数仓用维度建模。
    • 三范式建模:尽量不冗余,表数量较多。更适合业务系统, OLTP
    • 维度建模: 形成少量宽表,宽表内允许大量冗余,更适合离线数仓,OLAP

Znyoung大约 19 分钟大数据面试HiveSpark