大家好,又见面了。每次见面就说明我又解决了一个疑难杂症。今天这个问题更狠一些,又让我的sql能力有了进一步的提高。简单说我我最近为什么会有这么多的sql问题,主要原因就是我们从数据中台的hive库同步数据,而他们库里的数据实在是脏的过分,有各种你想象不到数据,而我们也推不动不了他们,没把办法就只能通过sql自己处理。

接下来看看今天的奇葩问题。我们同步过来的数据内容如下。

image.png

最可怕就是在类型的前面多了一些数字加顿号。这些内容对于我来讲是完全没有意义的,我需要的只是顿号后面的内容。那么我应该怎么处理得到后面的内容呢。最先想到的是split. 但是后来查了一下,mysql居然不支持split函数。真是让我大失所望。后来只能去找相近的函数,发现有一个INSTR() 函数,可以用来判断时段中是否包含某个字符串 ,并返回包含字符串对应的索引。在结合SUBSTR函数进行截取,就可以完美解决这个问题了。

同时还要注意,最好做下判断,只有当字段中包含这个字符串时才进行截取,不包含则不截取。最终得到的sql如下:

select 
year,
case when INSTR(subtype,'、')>0 then SUBSTR(subtype,INSTR(subtype,'、')+1)
else subtype END subtype
from 
xxx_table_name
复制代码

最终得到结果成功。

image.png
 

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐