1. common-pools提供的PoolableObjectFactory,针对pool池的管理操作接口
2. dbcp实现的pool从池管理操作
注意:
目前dbcp的pool的实现是使用了公用的apache common
pools进行扩展处理,所以和原生的连接池处理,代码看上去有点别扭,感觉自动重连这块异常处理不怎么好,我也就只重点关注了这部分代码而已 .
3.
dbcp的链接自动重链相关测试
相关场景:
-
数据库意外重启后,原先的数据库连接池能自动废弃老的无用的链接,建立新的数据库链接
-
网络异常中断后,原先的建立的tcp链接,应该能进行自动切换
测试需求1步骤
-
建立一testCase代码
-
配置mysql数据库
-
循环执行在SQL查询过程
-
异常重启mysql数据库
测试需求2步骤
-
建立一testCase代码
-
配置mysql数据库
-
循环执行在SQL查询过程
-
通过iptables禁用网络链接
/sbin/iptables -A INPUT -s
10.16.2.69 -j REJECT
/sbin/iptables -A FORWARD -p tcp -s 10.16.2.69 --dport 3306 -m
state --state NEW,ESTABLISHED -j DROP
5. iptables -F 清空规则,恢复链接通道。
测试需求问题记录
分别测试了两种配置,有validateObject的配置和没有validateObject的相关配置。
1. 没有validate配置
问题一: 异常重启mysql数据库后,居然也可以自动恢复链接,sql查询正常
跟踪了一下代码,发现这么一个问题:
-
在数据库关闭的时候,client中pool通过borrowObject获取一个异常链接返回给client
-
client在使用具体的异常链接进行sql调用出错了,抛了异常
-
在finally,调用connection.close(),本意是应该调用pool通过returnObject返回到的池中,但在跟踪代码时,未见调用GenericObjectPool的returnObject
-
继续查,发现在dbcp在中PoolingDataSource(实现DataSource接口)调用PoolableConnection(dbcp
pool相关的delegate操作)进行相应关闭时,会检查_conn.isClosed(),针对DataSource如果isClosed返回为true的则不调用returnObject,直接丢弃了链接
解释:
-
正因为在获取异常链接后,因为做了_conn.isClosed()判断,所以异常链接并没有返回到连接池中,所以到数据库重启恢复后,每次都是调用pool重新构造一个新的connection,所以后面就正常了
-
_conn.isClosed()是否保险,从jdk的api描述中: A connection is closed if the
method close has been called on it or if certain fatal errors have
occurred. 里面提供两种情况,一种就是被调用了closed方法,另一种就是出现一些异常也说的比较含糊。
问题二:validateObject调用时,dbcp设置的validationQueryTimeout居然没效果
看了mysql
statement代码实现,找到了答案。
mysql com.mysql.jdbc.statemen
部分代码
timeout时间处理:
Java代码
-
timeoutTask = new CancelTask();
-
//通过TimerTask启动一定时任务
-
Connection.getCancelTimer().schedule(timeoutTask, this.timeoutInMillis);
对应的CancelTask的代码:
Java代码
-
class CancelTask extends TimerTask {
-
-
long connectionId = 0;
-
-
CancelTask() throws SQLException {
-
connectionId = connection.getIO().getThreadId();
-
}
-
-
public void run() {
-
-
Thread cancelThread = new Thread() {
-
-
public void run() {
-
Connection cancelConn = null;
-
java.sql.Statement cancelStmt = null;
-
-
try {
-
cancelConn = connection.duplicate();
-
cancelStmt = cancelConn.createStatement();
-
// 简单暴力,再发起一条KILL SQL,关闭先前的sql thread id
-
cancelStmt.execute("KILL QUERY " + connectionId);
-
wasCancelled = true;
-
} catch (SQLException sqlEx) {
-
throw new RuntimeException(sqlEx.toString());
-
} finally {
-
if (cancelStmt != null) {
-
try {
-
cancelStmt.close();
-
} catch (SQLException sqlEx) {
-
throw new RuntimeException(sqlEx.toString());
-
}
-
}
-
-
if (cancelConn != null) {
-
try {
-
cancelConn.close();
-
} catch (SQLException sqlEx) {
-
throw new RuntimeException(sqlEx.toString());
-
}
-
}
-
}
-
}
-
};
-
-
cancelThread.start();
-
}
-
}
原因总结一句话:
queryTimeout的实现是通过底层数据库提供的机制,比如KILL QUERY pid.
如果此时的网络不通,出现阻塞现象,对应的kill命令也发不出去,所以timeout设置的超时没效果。
4.最后
最后还是决定配置testWhileIdle扫描,主要考虑:
-
pool池中的链接如果未被使用,可以通过testWhileIdle进行链接检查,避免在使用时后总要失败那么一次,可以及时预防
-
配合连接池的minEvictableIdleTimeMillis(空闲链接),removeAbandoned(未释放的链接),可以更好的去避免因为一些异常情况引起的问题,防范于未然。比如使用一些分布式数据库的中间件,会有空闲链接关闭的动作,动态伸缩连接池,这时候需要能及时的发现,避免请求失败。
-
testOnBorrow个人不太建议使用,存在性能问题,试想一下连接一般会在什么情况出问题,网络或者服务端异常终端空闲链接,网络中断你testOnBorrow检查发现不对再取一个链接还是不对,针对空闲链接处理异常关闭,可以从好业务端的重试策略进行考虑,同时配置客户端的空闲链接超时时间,maxIdle,minIdle等。
--------------------------------------------
新加的内容:
5.dbcp密码加密处理
以前使用jboss的jndi数据源的方式,是通过配置oracle-ds.xml,可以设置EncryptDBPassword,引用jboss
login-config.xml配置的加密配置。
Java代码
-
"EncryptDBPassword">
-
-
"org.jboss.resource.security.SecureIdentityLoginModule" flag="required">
-
"username">${username}
-
"password">${password_encrypt}
-
"managedConnectionFactoryName">jboss.jca:service=LocalTxCM,name=${jndiName}
-
-
-
为了能达到同样的效果,切换为spring
dbcp配置时,也有类似密码加密的功能,运行期进行密码decode,最后进行数据链接。
实现方式很简单,分析jboss的对应SecureIdentityLoginModule的实现,无非就是走了Blowfish加密算法,自己拷贝实现一份。
Java代码
-
private static String encode(String secret) throws NoSuchPaddingException, NoSuchAlgorithmException,
-
InvalidKeyException, BadPaddingException, IllegalBlockSizeException {
-
byte[] kbytes = "jaas is the way".getBytes();
-
SecretKeySpec key = new SecretKeySpec(kbytes, "Blowfish");
-
-
Cipher cipher = Cipher.getInstance("Blowfish");
-
cipher.init(Cipher.ENCRYPT_MODE, key);
-
byte[] encoding = cipher.doFinal(secret.getBytes());
-
BigInteger n = new BigInteger(encoding);
-
return n.toString(16);
-
}
-
-
private static char[] decode(String secret) throws NoSuchPaddingException, NoSuchAlgorithmException,
-
InvalidKeyException, BadPaddingException, IllegalBlockSizeException {
-
byte[] kbytes = "jaas is the way".getBytes();
-
SecretKeySpec key = new SecretKeySpec(kbytes, "Blowfish");
-
-
BigInteger n = new BigInteger(secret, 16);
-
byte[] encoding = n.toByteArray();
-
-
Cipher cipher = Cipher.getInstance("Blowfish");
-
cipher.init(Cipher.DECRYPT_MODE, key);
-
byte[] decode = cipher.doFinal(encoding);
-
return new String(decode).toCharArray();
-
}
最后的配置替换为:
Xml代码
-
<</span>bean id="dataSource" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close">
-
......
-
<</span>property name="password">
-
<</span>bean class="com.xxxxx.EncryptDBPasswordFactory">
-
<</span>property name="password" value="${xxxx.password.encrypted}" />
-
</</span>bean>
-
</</span>property>
-
........
-
</</span>bean>
--------------------------------------------
新加的内容:
6.数据库重连机制
常见的问题:
1. 数据库意外重启后,原先的数据库连接池能自动废弃老的无用的链接,建立新的数据库链接
2. 网络异常中断后,原先的建立的tcp链接,应该能进行自动切换。比如网站演习中的交换机重启会导致网络瞬断
3. 分布式数据库中间件,比如amoeba会定时的将空闲链接异常关闭,客户端会出现半开的空闲链接。
大致的解决思路:
1. sql心跳检查
主动式
,即我前面提到的sql validate相关配置
2. 请求探雷
牺牲小我,完成大我的精神。 拿链接尝试一下,发现处理失败丢弃链接,探雷的请求总会失败几个,就是前面遇到的问题一,dbcp已经支持该功能,不需要额外置。
3. 设置合理的超时时间,
解决半开链接. 一般数据库mysql,oracle都有一定的链接空闲断开的机制,而且当你使用一些分布式中间件(软件一类的),空闲链接控制会更加严格,这时候设置合理的超时时间可以有效避免半开链接。
一般超时时间,dbcp主要是minEvictableIdleTimeMillis(空闲链接)
, removeAbandonedTimeout(链接泄漏)。可以见前面的参数解释。