En CAPSiDE nuestra especialidad principal es administrar los sistemas de nuestros clientes para que puedan funcionar en 24×7 con todas las garantías de disponibilidad, seguridad y rendimiento. Por experiencia propia sabemos que detrás del concepto “administración de sistemas” se esconden muchas realidades distintas según la empresa que presta estos servicios. Por eso preferimos utilizar el término “ingeniería de sistemas” en su lugar, para remarcar las diferencias que existen en nuestro servicio.

El Concepto

La ingeniería de sistemas (u orientada a sistemas) es para nosotros la suma de:

que realizan su trabajo siguiendo una metodología única y compartida que asegurará una respuesta uniforme y de calidad constante para el cliente.

No hablamos sólo de un equipo de técnicos brillantes sino también de procedimientos homogéneos, de compartición de información y de herramientas de automatización que facilitan que cada persona pueda dar respuesta, minimizando los tiempos de aprendizaje y de adaptación.

Ingenieros, no sólo administradores

Nuestro trabajo de ingeniera empieza en el momento en que asumimos la responsabilidad de una plataforma existente o bien cuando diseñamos una plataforma desde cero.

En el primer caso realizamos una auditoría de sistemas orientada a disponer de una visión la más exacta posible del middleware instalado en la plataforma para preparar su adaptación a nuestros procesos.

En el segundo caso el primer trabajo importante es el diseño de la arquitectura tal y como lo explique en el previo articulo de blog “Architects of the digital Society”. Después instalamos la capa de middleware con procesos automatizados para disponer directamente de nuestros procesos de administración pre-configurados (arranque y parada de servicios, rotación de logs, configuración de seguridad, backups, etc). En ambos casos el proceso se realiza siempre con una comunicación fluida con nuestro cliente porque puede requerirse un importante trabajo de adaptación manual de las configuraciones según el tipo de aplicación y el uso que se derivará.

Uno de los procesos más importantes en la gestión que realizamos es la puesta en marcha (setup) de los servicios de monitorización. La monitorización nos permite disponer de datos en línea y de forma histórica.

“Sin datos no se pueden entender las situaciones que se presentan ni tomar decisiones.”

Paradójicamente muchas empresas no disponen ni tan solo de un servicio que les permita detectar situaciones críticas antes de que se conviertan en problema real. Muchas descubren las incidencias cuando ya se han hecho efectivas con todas las consecuencias negativas que se derivan como:

En la ingeniería de sistemas enfocamos el servicio de monitorización a la prevención de incidencias más que a su detección, avisando de forma temprana de tendencias que pueden poner en peligro la estabilidad de los servicios. Extendemos además la monitorización en distintos niveles de abstracción permitiendo que los técnicos tengan la visión técnica de los servicios y que los usuarios de negocio tengan una visión de más alto nivel con KPIs y SLAs (Business Monitoring).

Las tareas que componen la ingeniería de sistemas

El día a día de la ingeniería de sistemas se compone de múltiples tareas, enfocadas a dar respuesta a necesidades propias de nuestro servicio o a las de nuestros clientes. El origen de las tareas puede provenir de diferentes partes, en función de si son tareas reactivas (principalmente incidencias), proactivas (iniciadas por los ingenieros), rutinarias (programadas) o solicitadas por el cliente.

  1. Incidencias

    El aviso de una incidencia se puede originar directamente a raíz de una alerta de monitorización o bien por un aviso del cliente. Son clasificadas según los sistemas que afectan y según su criticidad.
    Se considera un incidente aquel que implica una interrupción o una degradación del servicio ofrecido por la plataforma. Garantizamos la resolución de incidentes 24 horas al día, 365 días al año. Al recibir el incidente nuestros ingenieros revisan el problema, diagnostican la causa y trabajan de inmediato en la restauración del servicio.

  2. Tareas Proactivas

    Son tareas que realiza el equipo de ingeniería de sistemas en respuesta a avisos de la monitorización para garantizar la seguridad, el rendimiento y la disponibilidad de los servicios, como por ejemplo: análisis de logs y/o eventos del sistema, cambios de configuraciones, etc.

  3. Tareas rutinarias

    El aspecto importante en estas tareas es su planificación y su seguimiento.
    Cuando la cantidad de sistemas se incrementa es imprescindible utilizar herramientas de planificación que puedan garantizar la apertura automática de tareas a realizar a los grupos que tocan.
    En las tareas rutinarias se incluyen: puesta en marcha de patches, realización de copias de seguridad, realización de pruebas de recuperación de copias de seguridad, etc. Entre todas las tareas destacamos dos en concreto que son diferenciales en nuestro servicio:

    • Pruebas rutinarias de recuperación de backup

      Muchos administradores de sistema se limitan a realizar copias de seguridad pero no prueban nunca los procesos de recuperación. De forma estándar nuestros servicios incluyen una recuperación trimestral de prueba de todos los tipos de datos que se han incluido en el backup (bases de datos, ficheros, etc).

    • Servicio de patching

      El objetivo del servicio es mantener el nivel de seguridad del Middleware gestionado en la plataforma del cliente. Se utilizan las bases de datos del NIST como base fiable de conocimiento para recibir las alertas con su nivel de riesgo y así poder actuar en consecuencia.
      Al recibir un aviso, las versiones de Software afectadas se cruzan con el inventario de cada cliente y se generan de forma dinámica los informes que se usan para realizar las tareas de patching (Patch Management) usando únicamente la información de relevancia para cada cliente.

  4. Peticiones de servicio

    Las peticiones de servicio son peticiones formuladas por el cliente a través de los canales estándares de soporte para realizar tareas concretas sobre los elementos de servicio de la plataforma. Las peticiones de servicios comprenden tareas de administración / gestión de sistemas y aplicaciones sobre la plataforma gestionada. Estas tareas son habitualmente cambios de configuración, añadido de funcionalidades, etc.

“Todos nuestros procesos están diseñados, documentados y se ejecutan siguiendo las normas de gestión de servicio ITIL.”

Organización del equipo de especialistas

Otro aspecto fundamental y diferenciador en nuestro servicio es la organización y funcionamiento del equipo de ingenieros. Hemos querido huir del modelo tradicional de soporte en varios Tiers de expertise que no responde a nuestro entender a las expectativas de los clientes ni tampoco a las del propio equipo técnico:

“En nuestro modelo existen grupos con un número reducido de ingenieros que dan soporte, realizan proyectos para clientes o tareas de mejora continúa de las herramientas internas.”

Los ingenieros van cambiando de grupo con una frecuencia establecida lo que permite a cada uno tener conocimiento de todas las áreas técnicas de la empresa y de tener contacto con todos los proyectos de clientes. Unas actividades regulares de formación permiten a cada ingeniero adquirir las bases de conocimiento comunes sobre clientes, herramientas y procesos y se potencia un grado de especialización de cada uno a través de formación externa y de certificaciones (Oracle, Microsoft, Linux, etc).

La flexibilidad de la organización permite responder a picos concretos de demanda en ciertas áreas de forma sencilla moviendo temporalmente ingenieros de grupo sin necesidad de formación ni de tiempo de adaptación. Para afrontar el crecimiento en el número de clientes se multiplican los pequeños grupos en cada área (soporte, proyecto, mejoras internas, etc.) con una especialización en clientes concretos y se extiende la rotación de los ingenieros entre esos grupos.

El resultado que conseguimos con esta mezcla de procesos, personas y herramientas es lo que denominamos la ingeniería de sistemas, modelo que hasta la fecha ha demostrado su validez por los buenos resultados que hemos conseguido con nuestros clientes.

TAGS: herramientas, procedimientos, sysadmin

speech-bubble-13-icon Created with Sketch.
Comments

Leave a Reply

Your email address will not be published. Required fields are marked *

*
*