关于springboot项目的tomcat之url解码问题

springboot内嵌的tomcat之url解码问题

亦土山而

3881人浏览 · 2022-09-02 20:59:59

亦土山而 · 2022-09-02 20:59:59 发布

最近遇到一个问题

spring-boot项目，收到对方get请求里面的中文，乱码。

get请求会经过url编码，里面的中文，同样也被转换，类似这样：

localhost:8080/callback/test?RetMsg=%B3%E4%D6%B5%CA%A7%B0%DC%A3%A1&Version=1.0

这串东西：%B3%E4%D6%B5%CA%A7%B0%DC%A3%A1 用gbk编码解出来就是“充值失败！”

用utf-8解出来就是乱码

因为对方是gbk编码，于是项目中配置一个 server.tomcat.uri-encoding: gbk

问题解决。

但是该项目并不是一个特定的项目，而是一个通用的项目，必须通过配置兼容各种编码，对于某一接入方来说是gbk，对于另外的接入方可能是utf-8

很明显，不能这样写死。

怎么办？

想到了在代码中处理，对乱码进行先url编码，再重新url解码

但是试了一些情况都没成功，比如上面举的那条例子，在配置文件中什么都不配置，然后用utf-8进行url编码或者iso-8859-1进行编码，再用本身的gbk编码，结果仍然是乱码。

经过一番尝试，发现在配置文件中这样配置：

server.tomcat.uri-encoding: iso-8859-1

然后在代码中对乱码进行iso-8859-1的url编码，然后再用配置的编码进行解码，问题解决。

content = URLDecoder.decode(URLEncoder.encode(content, "iso8859-1"), configCharset);

问题是解决了，还是想稍微深入了解一下，于是进行debug

调用request.getParameter：

String content = request.getParameter("RetMsg");

会调用到Request类的

public String getParameter(String name) { 
    if (!this.parametersParsed) { 
        this.parseParameters(); 
    } 
    return this.coyoteRequest.getParameters().getParameter(name); 
}

然后会进入到 parseParameters() 这个方法：

protected void parseParameters() { 
    this.parametersParsed = true; 
    Parameters parameters = this.coyoteRequest.getParameters(); 
    boolean success = false;

此时：

parameters：见截图

其中，charset 和 queryStringCharset 是构造方法中默认的：

public Parameters() { this.charset = StandardCharsets.ISO_8859_1; this.queryStringCharset = StandardCharsets.UTF_8; this.limit = -1; this.parameterCount = 0; this.parseFailedReason = null; this.tmpName = new ByteChunk(); this.tmpValue = new ByteChunk(); this.origName = new ByteChunk(); this.origValue = new ByteChunk(); }

跟着代码走，会调用到parseParameters()中的这段 parameters.handleQueryParameters();

最终走到：org.apache.tomcat.util.http.Parameters的processParameters()方法

这里的这个value还是encode的初始值（记住这张图，待会儿还要回来）