PreparedStatement的预编译原理

2021-10-03 02:32:44 阅读：120 来源： 互联网

标签：语句 PreparedStatement 数据库编译缓存 SQL 原理

PreparedStatement的预编译原理

preparedStatement 有三大优点：

代码的可读性和可维护性。
PreparedStatement尽最大可能提高性能。
最重要的一点是极大地提高了安全性。

其中一和三的确很易理解，关于性能的提高也是最有价值的这点，我对其原理还有些质疑。

网上一：
SQL 语句被预编译并且存储在 PreparedStatement 对象中，其后可以使用该对象高效地多次执行该语句。
问题：预编译在JDBC中完成的？还是数据库中？即便存在preparedStatement中，如果这个preparedStatement 对象不被缓存起来，其后又如何重复使用，多次执行? （一些webserver会缓存preparedStatement）
我想关于其性能的提高主要得需要数据库的支持。

oracle 性能优化写道：

共享SQL语句：为了不重复解析相同的SQL语句，在第一次解析之后，ORACLE将SQL语句存放在内存中。
可惜的是ORACLE只对简单的表提供高速缓冲(cache buffering) ，这个功能并不适用于多表连接查询。

个人理解：预编译是利用数据库的SQL共享来实现的，因为当使用preparedStatement时，尽管参数不同，但是在语句中用占位符"?"来替代。因此很多语句就完全相同。（这个道理和J2EE的server缓存preparedStatement 的道理应该是一样的）

问题：但是如果是这样的话，那么oracle的多表查询岂不是并无预编译效果？

问题：关于缓存：是否根据创建preparedStatement的语句来做为Key来map的？例如以下：是否检查匹配insert into tb_name (col1,col2,col2,col4) values (?, ?, ?, ?)来确定是否用已经有的执行路径来执行？

perstmt = con.prepareStatement("insert into tb_name (col1,col2,col2,col4) values (?,?,?,?)");

以下几篇从网络上搜索到的三篇文章：

CSDN 写道

一.代码的可读性和可维护性.
虽然用PreparedStatement来代替Statement会使代码多出几行,但这样的代码无论从可读性还是可维护性上来说.都比直接用Statement的代码高很多档次:

stmt.executeUpdate(

"insert into tb_name (col1,col2,col2,col4) values ('"+var1+"','"+var2+"',"+var3+",'"+var4+"')");

perstmt = con.prepareStatement("insert into tb_name (col1,col2,col2,col4) values (?,?,?,?)");
perstmt.setString(1,var1);
perstmt.setString(2,var2);
perstmt.setString(3,var3);
perstmt.setString(4,var4);
perstmt.executeUpdate();

不用我多说,对于第一种方法.别说其他人去读你的代码,就是你自己过一段时间再去读,都会觉得伤心.

二.PreparedStatement尽最大可能提高性能.
每一种数据库都会尽最大努力对预编译语句提供最大的性能优化.因为预编译语句有可能被重复调用.所以语句在被DB的编译器编译后的执行代码被缓存下来,那么下次调用时只要是相同的预编译语句就不需要编译,只要将参数直接传入编译过的语句执行代码中(相当于一个涵数)就会得到执行.这并不是说只有一个Connection中多次执行的预编译语句被缓存,而是对于整个DB中,只要预编译的语句语法和缓存中匹配.那么在任何时候就可以不需要再次编译而可以直接执行.而statement的语句中,即使是相同一操作,而由于每次操作的数据不同所以使整个语句相匹配的机会极小,几乎不太可能匹配.比如:
insert into tb_name (col1,col2) values ('11','22');
insert into tb_name (col1,col2) values ('11','23');
即使是相同操作但因为数据内容不一样,所以整个个语句本身不能匹配,没有缓存语句的意义.事实是没有数据库会对普通语句编译后的执行代码缓存.这样每执行一次都要对传入的语句编译一次.

当然并不是所以预编译语句都一定会被缓存,数据库本身会用一种策略,比如使用频度等因素来决定什么时候不再缓存已有的预编译结果.以保存有更多的空间存储新的预编译语句.

三.最重要的一点是极大地提高了安全性.

即使到目前为止,仍有一些人连基本的恶义SQL语法都不知道.
String sql = "select * from tb_name where name= '"+varname+"' and passwd='"+varpasswd+"'";
如果我们把[' or '1' = '1]作为varpasswd传入进来.用户名随意,看看会成为什么?

select * from tb_name = '随意' and passwd = '' or '1' = '1';
因为'1'='1'肯定成立,所以可以任何通过验证.更有甚者:
把[';drop table tb_name;]作为varpasswd传入进来,则:
select * from tb_name = '随意' and passwd = '';drop table tb_name;有些数据库是不会让你成功的,但也有很多数据库就可以使这些语句得到执行.

而如果你使用预编译语句.你传入的任何内容就不会和原来的语句发生任何匹配的关系.(前提是数据库本身支持预编译,但上前可能没有什么服务端数据库不支持编译了,只有少数的桌面数据库,就是直接文件访问的那些)只要全使用预编译语句,你就用不着对传入的数据做任何过虑.而如果使用普通的statement,有可能要对drop,;等做费尽心机的判断和过虑.

论坛写道

执行效率：Statement 采取直接编译 SQL 语句的方式，扔给数据库去执行，而 PreparedStatement 则先将 SQL 语句预编译一遍，再填充参数，这样效率会高一些。JDK 文档说：SQL 语句被预编译并且存储在 PreparedStatement 对象中，其后可以使用该对象高效地多次执行该语句。
代码可读性：Statement 中 SQL 语句中需要 Java 中的变量，加就得进行字符串的运算，还需要考虑一些引号、单引号的问题，参数变量越多，代码就越难看，而且会被单引号、双引号搞疯掉；而 PreparedStatement，则不需要这样，参数可以采用“?”占位符代替，接下来再进行参数的填充，这样利于代码的可读性，并且符合面向对象的思想。
安全性：Statement 由于可能需要采取字符串与变量的拼接，很容易进行 SQL 注入攻击，而 PreparedStatement 由于是预
编译，再填充参数的，不存在 SQL 注入问题。

Oracle 优化写道

共享SQL语句
　　为了不重复解析相同的SQL语句，在第一次解析之后， ORACLE将SQL语句存放在内存中。这块位于系统全局区域SGA(system global area)的共享池(shared buffer pool)中的内存可以被所有的数据库用户共享。因此，当你执行一个SQL语句(有时被称为一个游标)时，如果它和之前的执行过的语句完全相同， ORACLE就能很快获得已经被解析的语句以及最好的执行路径。 ORACLE的这个功能大大地提高了SQL的执行性能并节省了内存的使用。

　　可惜的是ORACLE只对简单的表提供高速缓冲(cache buffering) ，这个功能并不适用于多表连接查询。

问题补充：
感谢geeksun的回答，我的理解是：
问题１，　PreparedStatement是jdbc 驱动包里的一个类，并不是说存储在jdbc中。
问题2，我认为多表查询不支持预编这是不可能的。
问题3，我想这样提问可能更好一些。
java 方法如下：

protected boolean updateSalary(Connection conn,BigDecimal x,String ID) throws SQLException{
    PreparedStatement pstmt = null;
    try {
        pstmt = conn.prepareStatement("UPDATE EMPLOYEES SET SALARY = ? WHERE ID = ?");
        pstmt.setBigDecimal(1, x);
        pstmt.setString(2, ID);
        return true;
    } finally{
        if (pstmt!=null){
            pstmt.close();
        }
    }
}

第一次调用以后，是否会缓存PreparedStatement, 这个在用weblogic这种server的时候是可以肯定的。因为从数据源的来connection是一个包装类，不是jdbc驱动的connection，而用connection来创建的PreparedStatement也是封装类。因此尽管pstmt.close().但是实际被封装的PreparedStatement并未关闭。
但是是第二次调用这个方法，会重新conn.prepareStatement，这个时候我想应该是根据语句来作为key来寻找缓存的preparedStatement,但是尽管取到缓存。如果没有Database的配合，效率也很难提高多少。
问题补充：
谢谢geeksun的帮忙，Sql的共享我想肯定是支持多表的。至于高速缓存应该讲的是结果的缓存。
但是你对PreparedStatement的观点我认为是不对的。因为这个对象肯定是在WebServer端的，不可能跑到数据库那端。K-V对应的K值应该就是创建这个对象的那条语句，只是需要一个精通人士的肯定。

答案补充：
1. 昨天又研究了一下PreparedStatement,这里纠正一下观点，PreparedStatement在第一次编译后，存放在数据库里，类似于K-V对应的方式存储，这样，当下一条同样的PreparedStatement发送到数据库里，数据库查找到有相应的K存在，就调用K中的方法，省却了再去重新创建语句的过程，提高数据库的性能。
2. 多表查询支持不支持预编译？这个问题，我想请教一下oracle的DBA比较好一些。
3. 在J2EE的应用服务器的PreparedStatement缓存，个人认为，这里缓存的不是真正的缓存，而是数据库的PreparedStatement缓存的代理，不过应用服务器的PreparedStatement缓存和数据库里的PreparedStatement缓存保持一致，这样做，可能是应用服务器在管理PreparedStatement缓存时有它自己的比较好的实现策略，比单纯的使用JDBC使用数据库的缓存具有更好的性能或内存管理。

1. PreparedStatement是存储在JDBC里的，初始化后，缓存到了JDBC里，初始化的开销比Statement大，对于少量的查询操作没有优势，适用于大量的查询语句才能体现性能的优势。
2. ORACLE只对简单的表提供高速缓冲(cache buffering) ，这个功能并不适用于多表连接查询，回答了第二个问题"oracle的多表查询并无预编译效果".
3. 问题：关于缓存：是否根据创建preparedStatement的语句来做为Key来map的？
应该是这样的，例：
PreparedStatement pstmt = con.prepareStatement("UPDATE EMPLOYEES
SET SALARY = ? WHERE ID = ?");
pstmt.setBigDecimal(1, 153833.00);
pstmt就是缓存的key，在缓存中存的是pstmt对象。

标签：语句,PreparedStatement,数据库,编译,缓存,SQL,原理
来源： https://www.cnblogs.com/JaxYoun/p/15363197.html

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

PreparedStatement的预编译原理

PreparedStatement的预编译原理