Hoy decimos

Resolvemos tus problemas - Conversá con nosotros

viernes, 20 de septiembre de 2013

Optimizar para ahorrar recursos y reutilizarlos

Por medio de la implementación de herramientas de análisis y registro de datos de rendimiento, como Ganglia por ejemplo, y al cabo de un tiempo de recolectar datos se puede estudiar qué tantos recursos informáticos de los disponibles son consumidos efectivamente por las aplicaciones y servicios en uso en la infraestructura. 

En base a ello se puede delinear una estrategia y un plan de acción para optimizar el uso de los recursos informáticos de la organización.

Componentes ociosos
En casi cualquier organización, no es una sorpresa que mucha de la información recolectada llegue a mostrar que en el día a día de la utilización de recursos solo hay unos pocos componentes que hacen un uso intensivo de la infraestructura informática. El resto de los componentes de la infraestructura permanecen ociosos en general.

Esta noción no es nueva, justamente fue parte de la idea en la creación de servicios de nube como AWS, donde la empresa determinó que la infraestructura típica estaba la mayor parte del tiempo ociosa, sin carga significativa, sin realizar ningún trabajo relevante. Los servicios de nube nacieron - internamente al principio - para optimizar el consumo de recursos y lograr disminuir o suprimir los tiempos ociosos para dedicar más horas - todas las horas idealmente - a consumir lucrativamente los recursos tan costosamente adquiridos para la infraestructura.

En menor escala, hablando de infraestructuras chicas, medianas, por ejemplo de 2, 4, 16, 256 servidores físicos (y su correspondiente colección de recursos complementarios: networking, storage, espacio físico, previsión de presupuesto para actualización / renovación / expansión, etc.), inclusive si son parte de una infraestructura virtual, es típico que ocurra que hay importantes períodos de tiempo en los cuales la infraestructura permanece ociosa, básicamente todo el hardware está "arrancado", el software "corriendo", pero ningún proceso ni usuario están usando los servicios que ellos brindan. Lo que es un claro desperdicio de recursos.

Hotspots
Estudiando la información global producida por herramientas como Ganglia, Splunk, Logwatch y otros analizadores similares de consumo y uso de recursos y servicios, se puede "ver" claramente que muchos recursos implementados globalmente en la infraestructura como "muy resilientes" (con altos niveles de redundancia, alta disponibilidad, etc.), en realidad no necesitarían tan altos niveles de prestaciones tan costosas de adquirir y poseer (es decir no solo hablamos aquí en términos de costos monetarios, sino de TCO), focalizándose - en la práctica, en la realidad - la necesidad de gran resiliencia y disponibilidad de recursos en unas pocas áreas específicas (hotspots, "puntos calientes") de la infraestructura: por ejemplo, en servidores físicos/virtuales puntuales (y recursos complementarios), en servicios específicos, en determinadas franjas horarias. Ni más ni menos.

Es decir, quitando los hotspots, el resto de la infraestructura fue altamente "fortificado" sin una necesidad organizacional real y esos recursos ya adquiridos se están malgastando.

El hardware comprado está allí, el software también, pero nadie los va a utilizar a una escala que no sea mucho - o muchísimo - menor en comparación a los "puntos calientes" (hotpots), de la infraestructura.

Recursos de IT netos
Dado un apropiado estudio de la información histórica de performance de la infraestructura, podríamos localizar los "puntos calientes" de la infraestructura, focalizar allí el fortalecimiento de la provisión de recursos y optimizar - disminuir en gral. - dicha "fortaleza" en otras áreas de la infraestructura donde no es igualmente necesaria.

Los recursos que no se dispensen y que se ahorran al focalizarse en los hotspots pueden luego ser dedicados exactamente al mismo destino que antes hubieran tenido: actualización / renovación / expansión de la infraestructura, pero con una pertinencia neta en grado sumo mayor respecto de lo que antes hubiera significado y/o requerido un incremento bruto de recursos de infraestructura a añadir a lo ya existente.

Conclusiones
La infraestructura de tecnologías de la información típica desperdicia consistentemente grandes cantidades de recursos escasos y/o costosos de adquirir (hardware, software, presupuesto, caras horas / hombre de administradores, necesarias para la administración, gestión, configuración, etc.).

De una infraestructura típica - y con fundamento técnico analítico sólido, basado en datos concretos obtenidos de mediciones pertinentes y/o al menos con estimaciones bien fundadas en alguna previa correcta captura información de performance - se puede "extraer" típicamente suficientes recursos, tal que liberados de su uso anterior, permiten ampliar la capacidad de provisión de servicios de la infraestructura en porcentajes muy importantes, sin que para ello sea indispensable recurrir a nuevas adquisiciones.

Típicamente los recursos liberados para reutilizarse pueden representar tan poco como un humilde 10% hasta grandes porcentajes del total en uso en la infraestructura previo a las optimizaciones.

En 2012 justamente tuve la oportunidad de elevar - muy excepcionalmente - un 200% el ratio de utilización de recursos en una infraestructura; el cual dispuso luego del doble de recursos de infraestructura que tenía antes de la optimización. Es importante considerar que la optimización no solo liberó recursos técnicos, sino también determinada cantidad de horas/hombre que se volvieron disponibles para dedicar a implementar nuevos servicios y optimizar aún más la infraestructura (ya incurriendo así en prácticas de mejora contínua).


Links:

Ganglia Offers New Monitoring System Possibilities (April 2007)
http://www.ibmsystemsmag.com/aix/administrator/performance/Ganglia-Offers-New-Monitoring-System-Possibilities/?page=4

Whole Power Server + Virtual Server Monitoring - Part 5 via Ganglia (May 2011)
https://www.ibm.com/developerworks/community/blogs/aixpert/entry/whole_power_server_virtual_server_monitoring_part_5_via_ganglia116?lang=en

Monitoring Systems and POWER5/6 LPARs with Ganglia (April 2012)
http://www.slideserve.com/linus/monitoring-systems-and-power5

No hay comentarios:

Publicar un comentario