为什么在 Java 中 PreparedStatement 能够有效防止 SQL 注入? 这可能是每个 Java 程序员思考过的问题.
首先我们来看下直观的现象 (注: 需要提前打开 MySQL 的 SQL 文打印)
1. 不使用 PreparedStatement 的 set 方法设置参数 (效果跟 Statement 相似, 相当于执行静态 SQL)
- String param = "'test' or 1=1";
- String sql = "select file from file where name =" + param; // 拼接 SQL 参数
- PreparedStatement preparedStatement = connection.prepareStatement(sql);
- ResultSet resultSet = preparedStatement.executeQuery();
- System.out.println(resultSet.next());
输出结果为 true,DB 中执行的 SQL 为
-- 永真条件 1=1 成为了查询条件的一部分, 可以返回所有数据, 造成了 SQL 注入问题
select file from file where name = 'test' or 1=1
2. 使用 PreparedStatement 的 set 方法设置参数
- String param = "'test' or 1=1";
- String sql = "select file from file where name = ?";
- PreparedStatement preparedStatement = connection.prepareStatement(sql);
- preparedStatement.setString(1, param);
- ResultSet resultSet = preparedStatement.executeQuery();
- System.out.println(resultSet.next());
输出结果为 false,DB 中执行的 SQL 为
select file from file where name = '\'test\'or 1=1'
我们可以看到输出的 SQL 文是把整个参数用引号包起来, 并把引号作为转义字符, 从而避免了参数也作为条件的一部分
接下来我们分析下源码 (以 MySQL 驱动实现为例)
打开 java.sql.PreparedStatement 通用接口, 看到如下注释, 了解到 PreparedStatement 就是为了提高 statement(包括 SQL, 存储过程等) 执行的效率.
- An object that represents a precompiled SQL statement.
- A SQL statement is precompiled and stored in a PreparedStatement object.
- This object can then be used to efficiently execute this statement multiple times.
那么, 什么是所谓的 "precompiled SQL statement" 呢?
回答这个问题之前需要先了解下一个 SQL 文在 DB 中执行的具体步骤:
Convert given SQL query into DB format -- 将 SQL 语句转化为 DB 形式 (语法树结构)
Check for syntax -- 检查语法
Check for semantics -- 检查语义
Prepare execution plan -- 准备执行计划 (也是优化的过程, 这个步骤比较重要, 关系到你 SQL 文的效率, 准备在后续文章介绍)
Set the run-time values into the query -- 设置运行时的参数
Run the query and fetch the output -- 执行查询并取得结果
而所谓的 "precompiled SQL statement", 就是同样的 SQL 文 (包括不同参数的),1-4 步骤只在第一次执行, 所以大大提高了执行效率 (特别是对于需要重复执行同一 SQL 的)
言归正传, 回到 source 中, 我们重点关注一下 setString 方法 (因为其它设置参数的方法诸如 setInt,setDouble 之类, 编译器会检查参数类型, 已经避免了 SQL 注入.)
查看 MySQL 中实现 PreparedStatement 接口的类 com.MySQL.jdbc.PreparedStatement 中的 setString 方法 (部分代码)
- public void setString(int parameterIndex, String x) throws SQLException {
- synchronized (checkClosed().getConnectionMutex()) {
- // if the passed string is null, then set this column to null
- if (x == null) {
- setNull(parameterIndex, Types.CHAR);
- } else {
- checkClosed();
- int stringLength = x.length();
- if (this.connection.isNoBackslashEscapesSet()) {
- // Scan for any nasty chars
- // 判断是否需要转义处理 (比如包含引号, 换行等字符)
- boolean needsHexEscape = isEscapeNeededForString(x, stringLength);
- // 如果不需要转义, 则在两边加上单引号
- if (!needsHexEscape) {
- byte[] parameterAsBytes = null;
- StringBuilder quotedString = new StringBuilder(x.length() + 2);
- quotedString.append('\'');
- quotedString.append(x);
- quotedString.append('\'');
- ...
- } else {
- ...
- }
- String parameterAsString = x;
- boolean needsQuoted = true;
- // 如果需要转义, 则做转义处理
- if (this.isLoadDataQuery || isEscapeNeededForString(x, stringLength)) {
- ...
从上面加红色注释的可以明白为什么参数会被单引号包裹, 并且类似单引号之类的特殊字符会被转义处理, 就是因为这些代码的控制避免了 SQL 注入.
这里只对 SQL 注入相关的代码进行解读, 如果在 setString 前后输出预处理语句 (preparedStatement.toString()), 会发现如下输出
- Before bind: com.MySQL.jdbc.JDBC42PreparedStatement@b1a58a3: select file from file where name = ** NOT SPECIFIED **
- After bind: com.MySQL.jdbc.JDBC42PreparedStatement@b1a58a3: select file from file where name = '\'test\'or 1=1'
编程中建议大家使用 PrepareStatement + Bind-variable 的方式避免 SQL 注入
来源: https://www.cnblogs.com/roostinghawk/p/9703806.html