Tabla de Contenidos
Pool de conexiones
El pool de conexiones es una técnica usada en aplicaciones Web para mejorar el rendimiento de las aplicaciones Web.
Antes de ver en que consiste , veamos como funciona la creación de conexiones en una aplicación clásica de escritorio cliente-servidor y luego veamos los problemas se seguir con dicha estructura en una aplicación web.
Problemas en la creación de conexiones
En una aplicación de escritorio se crea una conexión de base de datos al iniciar la aplicación y se cierra al finalizar la aplicación. Es decir que cada usuario que inicia la aplicación tiene una conexión en exclusiva para él. Y obviamente sería imposible compartirlas ya que cada aplicación estará en un ordenador independiente.
En una aplicación Web podríamos seguir un esquema similar , en el que cada usuario nuevo que se conecta a nuestra aplicación se le crea una conexión y al salir de la aplicación que se cierre su conexión.
Esto que aparentemente es sencillo tiene unos problemas debido a la diferente naturaleza de las aplicaciones de escritorio y las web.
Característica | Escritorio | Web | Problemas |
---|---|---|---|
Número de usuarios | Bajo. Suele estar limitado por el tamaño de una oficina o edificio. | Muy alto. Potencialmente toda internet. | En la Web si cada usuario tiene una conexión propia para él se podría saturar el servidor de base de datos |
Momento de cierre de la conexión | Claramente definido al cerrar la aplicación | Vagamente definido | En Web es complejo saber cuando el usuario abandona el portal (que no la página) para en ese momento cerrar la conexión |
Si siguiéramos el mismo patrón de creación de conexiones de aplicaciones de escritorio en aplicaciones web acabaríamos con una cantidad enorme de conexiones activas (debido al gran número de usuarios) y con gran cantidad de conexiones abiertas sin usar (debido a usuarios que abandonan el portal y no lo hemos detectado)
Consecuencia de los anterior al tener tantas conexiones a la base de datos se acabaría cayendo el servidor de base de datos debido a los recursos consumidos por todas las conexiones.
Podemos pensar que nuestro servidor puede aguantar todas esas conexiones ya que podemos tener pocos usuarios pero no suele ser así debido a:
- Si no se cierran las conexiones aun teniendo pocos usuarios es probable que acabemos saturando al servidor de conexiones sin usar.
- Las aplicaciones Web pueden tener picos de mucho tráfico (como en las épocas de matriculación) donde sería normal que se excediera la capacidad de nuestro servidor.
- Sería muy sencillo hacernos un ataque de denegación de servicio y saturando el servidor haciendo que se crearan gran cantidad de conexiones que no se usen.
Una solución chapuza que nos evitaría las conexiones sin usar sería que se creara la conexión al iniciar cada petición web y se cerrara al finalizar dicha petición web. ¿El problema de eso? Crear y cerrar una conexión es muy costoso. Lo que tendríamos es una aplicación lentísima.
Pool de conexiones
La solución del pool de conexiones tiene que solucionar los siguientes problemas:
- No tener tantas conexiones como usuarios ya que el nº de usuarios es demasiado elevado.
- Cerrar la conexión.
La solución de cerrar la conexión se solucionaría fácilmente con la técnica de crearla al inicio de la petición y de cerrarla al final de la petición. Pero como ya hemos visto tiene el problema de lo lenta que sería la aplicación. Pero eso se puede solucionar con el Pool de conexiones
Así que por fin pasemos a explicar en que consiste el pool de conexiones:
El pool de conexiones consiste en tener un conjunto (pool) de conexiones ya conectadas a la base de datos que puedan ser reutilizadas entre distintas peticiones.
Veamos como funciona:
- El servidor web tiene “n” conexiones ya creadas y conectadas a la base de datos (Se llaman conexiones esperando)
- Cuando llegan “m” peticines web , la aplicación pide “m” conexiones al pool de conexiones,quedando esperando en el pool “n-m” conexiones. Esta operación es muy rápida ya que la conexión ya está creada y solo hay que marcarla como que alguien la está usando. Ahora hay “m” conexiones activas que está usando la aplicación.
- Cuando las peticiones web finalizan, las conexiones no se cierran sino que se devuelven al pool indicándole que ya se han acabado de usar las conexiones. Ahora vuelve a quedar “n” conexiones esperando en el pool. Esta operación también es muy rápida ya que realmente no se cierra ninguna conexión sino que simplemente se marcan como que ya no las están usando nadie.
- Si se piden más conexiones de las que hay esperando en el pool se crearán en ese instante nuevas conexiones hasta el máximo de conexiones que permita el pool
- Al devolver una conexión al pool , ésta se queda esperando para que otra petición la pueda usar. Si hay ya demasiadas conexiones esperando a ser usadas se cerrarán para ahorrar recursos en el servidor de base de datos.
¿Que hemos conseguido con el pool?
- Ahora las conexiones ya no se quedarán abiertas cuando el usuario se marcha del portal ya que cada conexión se pseudo-abre y pseudo-cierra con cada petición.
- No tenemos tantas conexiones como usuarios usan la aplicación ya que solo se necesitan tantas como usuarios hay haciendo una petición en ese instante. Pensemos por un momento en facebook. ¿cuandos usuarios están conectados a facebook? Supongamos “x”. Pero ¿cuantos están realmente haciendo una petición y no viendo los datos que se han servido? Supongamos “y”. Obviamente “y” es mucho menor que “x”. Con lo que nos hemos ahorrado “x-y” conexiones.
Ejemplo de Pool
Veamos ahora un ejemplo de uso de un pool de conexiones que ha sido configurado de la siguiente forma:
- Máximo de conexiones: 200
- Maximo de conexiones esperando: 50
En la siguiente gráfica vemos un ejemplo de como podrían evolucionan las conexiones del pool:
Tiempo (s) | Maximo | Activas | Esperando |
---|---|---|---|
10 | 200 | 100 | 50 |
20 | 200 | 120 | 30 |
30 | 200 | 140 | 10 |
40 | 200 | 140 | 50 |
50 | 200 | 140 | 50 |
60 | 200 | 100 | 90 |
70 | 200 | 100 | 50 |
80 | 200 | 70 | 80 |
90 | 200 | 70 | 50 |
100 | 200 | 150 | 0 |
110 | 200 | 150 | 50 |
120 | 200 | 90 | 110 |
130 | 200 | 90 | 50 |
En la gráfica podemos ver como el máximo de conexiones que puede haber es 200 y por lo tanto de usuarios activos es de 200. Este valor es constante ya que es tal y como hemos configurado el pool. Eso no quiere decir que no pueda haber mas usuario reales en ese momento siempre y cuando estén mirando su navegador y no actuando con el servidor. También se ve como a lo largo del tiempo va variando el nº de usuarios activos, sin llegar nunca a 200.
En el instante 60 bajan bruscamente el nº de conexiones activas de 140 a 100 por lo que se quedan 90 conexiones esperando, como son demasiadas el propio pool desconecta conexiones y en el instante 70 vuelven a ser solo 50 las conexiones esperando a ser usadas. Lo mismo pasa en el instante 80.
En el instante 100 hay una fuerte subida de conexiones activas y no hay suficientes esperando para absorber la subida de usuarios, asi que en ese caso se deben crear 30 nuevas conexiones. Esto hará que se deban esperar un poco los 30 usuarios que les toque la creación de la conexión.Sin embargo en el instante 120 hay una caída brusca de usuarios con lo que vuelven a sobrar conexiones esperando. En ese caso se da la curiosidad de que hay mas conexiones esperando (110) que activas (90). En el siguiente instante (110 s) vemos como el pool ha cerrado conexiones para volver a tener las 50 con las que ha sido configurado.
Usando el pool de conexiones desde Java
Desde Java podemos acceder al pool de conexiones usando la interfaz javax.sql.DataSource. Al llamar al método getConnection() se obtendrá una conexión del pool de conexiones y no se creará nueva en ese momento. Cuando llamemos al método java.sql.Connection.close() realmente la conexión no se cerrará sino que se devolverá al pool de conexiones.
DataSource dataSource; Connection connection=dataSource.getConnection(); //Obtener la conexión del pool //Usar la conexión connection.close(); //No se cierra realmente la conexión sino que se retorna al pool
Ahora nos queda saber como obtener un objeto DataSource. Para obtener un objeto DataSource necesitamos primero configurar el pool de conexiones mediante el fichero context.xml
, cosa que vamos a ver en el siguiente apartado. Ahora simplemente debemos saber que en un mismo servidor web puede haber muchos pool de conexiones por lo que cada uno de ellos tiene un nombre único. Para obtener el DataSource asociado a un pool de conexiones debemos incluir el siguiente código:
InitialContext initCtx=new InitialContext();; Context envCtx = (Context) initCtx.lookup("java:comp/env"); DataSource dataSource = (DataSource)envCtx.lookup("jdbc/hibernate1");
Siendo jdbc/hibernate1
el nombre del pool de conexiones.
Configurando el pool de conexiones en Tomcat 7
Por último nos queda configurar el pool de conexiones. Cada servidor web puede usar su propia implementación del pool de conexiones y se configura de forma específica. Nosotros vamos a explicar como configurar el pool que viene incluido en Tomcat 7.
El pool se configura añadiendo un fichero llamado context.xml
en la carpeta META-INF
.
- 1 |context.xml
<?xml version="1.0" encoding="UTF-8"?> <Context path="/ejemplo05"> <Resource type="javax.sql.DataSource" auth="Container" name="jdbc/hibernate1" driverClassName="com.mysql.jdbc.Driver" url="jdbc:mysql://localhost:3306/hibernate1" username="hibernate1" password="hibernate1" maxActive="100" maxIdle="30" maxWait="10000" validationQuery="SELECT 1 FROM dual" /> </Context>
- La líneas 4 y 5 indica que este recurso que estamos creando es un pool de conexiones.
- El atributo 'name' de la línea 6 indica el nombre del pool de conexiones que el el nombre que usamos en la línea de Java
envCtx.lookup(name)
- El atributo 'driverClassName' de la línea 7 indica la FQCN del driver de JDBC que vamos a usar para conectarnos a la base de datos.
- El atributo 'url' de la línea 8 indica la URL de conexión a la base de datos
- El atributo 'username' de la línea 9 indica el usuario de conexión a la base de datos
- El atributo 'password' de la línea 10 indica la contraseña de conexión a la base de datos
Hasta ahora solo hemos indicado los atributo básicos de conexión a la base de datos, veamos ahora los atributos concretos del pool:
- El atributo 'maxActive' de la línea 12 indica el número máximo de conexiones que pueden usarse. Esto indicará el nº máximo de usuarios que podrá haber a la vez haciendo peticiones.Si hay más usuarios se producirá un error indicando que ya no hay conexiones.
- El atributo 'maxIdle' de la línea 13 indica el número máximo de conexiones que puede haber esperando a que llegue un usuario para usarlas. Si hay demasiadas conexiones esperando Tomcat empezará a cerrarlas hasta que baje hasta el valor
maxIdle
. Ésto se hace para ahorrar recursos del servidor de base de datos. - El atributo 'maxWait' de la línea 14 indica el tiempo en ms que esperará Tomcat a que haya una conexión libre en caso de que no hubiera ninguna libre en ese instante.
- El atributo 'validationQuery' de la línea 15 indica una SQL de tipo
SELECT
que lanza Tomcat para comprobar que la conexión aun está conectada a la base de datos y que ésta ultima no la ha cerrado unilateralmente.
validationQuery
ya que sino se podría usar una conexión que la base de datos ha cerrado pero que Tomcat cree que aun está conectada.
- El parámetro de configuración
maxActive
ha sido renombrado a maxTotal - El parámetro de configuración
maxWait
ha sido renombrado a maxWaitMillis
Mas información en Apache Tomcat - Migration Guide - Tomcat 8.0.x - Database Connection Pooling y en Apache Commons BDCP