前几天遇到这么一个需求,有一个字符串,表示用户在网站的访问路径,例如“home>itemdetail>cart>order”格式,当用户访问路径不足8步的时候,返回这个字符串,当访问路径大于8步的时候返回前8步路径。
实现的时候,我首先就想到了substring()函数,但转念一想,我需要截取第8个“>”字符前面的数据,那么我必须要知道这个>在字符串中的位置,中间考虑过几个函数都搞不定,比如instr()只能知道第一个“>”的位置;find_in_set()也不行,跟这个不搭边;regexp_extract()因为正则表达式没写明白放弃了。根据需求百度了一下,还是没找到,找了pdf版HiveSql开发指南,居然也没有符合条件的函数,不过冥冥之中,我感觉到,一定有一个hive内置字符串函数,可以搞定这个问题,于是去翻hive官方文档,地址:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF
在这里插入图片描述
没错!就是这个substring_index()函数,正好符合这个需求。下面是试验sql结果截图:
在这里插入图片描述
后记:写这篇博客主要因为百度的时候没找到substring_index()这个函数,在技术文档中也是没找到,所以在这里记录一下,希望有所帮助。

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐