1.语法

语法: if(boolean testCondition, T valueTrue, T valueFalseOrNull)
说明: 当条件testCondition为TRUE时,返回valueTrue;否则返回valueFalseOrNull

2.基本实例

在mysql中,hive中基本一致

在mysql中

select source,if(source='猎聘',1,2) as flag from t_cal_dowell_resume

在hive中

select a,b,c,if(b='上帝',1,2) as bb from tmp.csv_t1 

3.实战

3.1:数据准备

表1:拉链表 dwd_dim_user_info_his ,2019-01-01

用户ID姓名开始时间结束时间
1张三2019-01-019999-99-99
2李四2019-01-019999-99-99
3王五2019-01-019999-99-99

表2:用户变化表 ods_user_info ,2019-01-02

用户ID姓名
1张三
2李小四
3王五
4赵六
5田七

3.2:需求一:得到临时拉链表 dwd_dim-user_info_his_tmp, 2019-01-02

如下图

用户ID姓名开始时间结束时间
1张三2019-01-019999-99-99
2李四2019-01-012019-01-01
2李小四2019-01-029999-99-99
3王五2019-01-019999-99-99

SQL如下:

 select 
        uh.id,
        uh.name,
        uh.start_date,
        if(ui.id is not null  and uh.end_date='9999-99-99', date_add(ui.dt,-1), uh.end_date) end_date
    from dwd_dim_user_info_his uh left join 
    (
        select
            *
        from ods_user_info
        where dt='2019-01-02'
    ) ui on uh.id=ui.id

3.2:需求二:得到临时拉链表 dwd_dim-user_info_his_tmp, 2019-01-02

如下图

用户ID姓名开始时间结束时间
1张三2019-01-019999-99-99
2李四2019-01-012019-01-01
2李小四2019-01-029999-99-99
3王五2019-01-019999-99-99
4赵六2019-01-029999-99-99
5田七2019-01-029999-99-99
select * from 
(
    select 
        id,
        name,
        '2021-03-21' start_date,
        '9999-99-99' end_date
    from ods_user_info where dt='2019-01-02') 
    union all 
    select 
        uh.id,
        uh.name,
        uh.start_date,
        if(ui.id is not null  and uh.end_date='9999-99-99', date_add(ui.dt,-1), uh.end_date) end_date
    from dwd_dim_user_info_his uh left join 
    (
        select
            *
        from ods_user_info
        where dt='2019-01-02'
    ) ui on uh.id=ui.id
)his 
order by his.id, start_date;

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐