Historia de la Pregunta

Las empresas que atraviesan una transformación digital suelen operar en entornos complejos de "brownfield" donde transacciones bancarias críticas continúan siendo procesadas por mainframes COBOL de décadas de antigüedad en sistemas IBM z/OS. Simultáneamente, los flujos de incorporación y servicio orientados al cliente se manejan cada vez más a través de modernos portales web basados en React y aplicaciones móviles. Esta divergencia tecnológica crea un desafío significativo de validación para los equipos de QA, que deben asegurar un flujo de datos fluido, libre de errores, y la consistencia transaccional a través de estas arquitecturas fundamentalmente dispares.

Tradicionalmente, los esfuerzos de automatización en dichos entornos se convierten en silos, con equipos especializados manteniendo conjuntos de herramientas separados para la emulación de terminales de mainframe (como Jagacy o Extra!), automatización UI genérica (Selenium o Cypress) y validación de API (Rest-Assured o Postman). Esta fragmentación conduce a suites de integración frágiles escritas en jerga técnica altamente especializada que los analistas de negocios no técnicos no pueden revisar o validar contra los requisitos. Además, problemas catastróficos de integridad de datos emergen frecuentemente cuando una prueba falla a mitad de ejecución, potencialmente dejando una cuenta de mainframe creada mientras la verificación del portal web correspondiente permanece incompleta, contaminando así los entornos posteriores con datos de prueba huérfanos.

Esta pregunta específica surgió de una empresa de servicios financieros de Fortune 500 que luchaba por validar un complejo flujo de trabajo de "nueva incorporación de clientes" que abarcaba una aplicación móvil de React, un bus de eventos Kafka, una capa de microservicios Java y la provisión final de cuentas en un mainframe IBM z/OS. La organización requería una estrategia de automatización unificada que pudiera unir estas divisiones técnicas mientras mantenía la agilidad esperada en los pipelines modernos de DevOps. El desafío se complicó aún más por la necesidad de que los analistas de negocios redactaran y comprendieran escenarios de prueba sin entender las implementaciones técnicas subyacentes de cada sistema.

El Problema

El desafío central radica en la incompatibilidad fundamental entre la automatización web síncrona, que espera actualizaciones inmediatas del DOM y interacciones basadas en eventos, y la emulación de terminal en modo bloque de los mainframes 3270, que depende de la captura de pantalla explícita y la posición precisa del cursor. Las APIs REST introducen una complejidad adicional al operar dentro de un paradigma de solicitud-respuesta sin estado que carece de la continuidad de sesión inherente a las sesiones de terminal. Conectar estos estilos arquitectónicos requiere una capa de abstracción capaz de traducir acciones comerciales de alto nivel en comandos específicos del sistema sin filtrar detalles técnicos de implementación en los escenarios de prueba.

Mantener un Lenguaje Específico de Dominio (DSL) unificado utilizando herramientas como Gherkin se vuelve extremadamente difícil cuando las implementaciones técnicas de los pasos de prueba divergen de manera tan salvaje entre los sistemas. Los elementos web se identifican típicamente utilizando selectores CSS o expresiones XPath, las validaciones de API dependen de afirmaciones de ruta JSON y validación de esquema, mientras que las interacciones de mainframe dependen de coordenadas de campo, etiquetas de pantalla o secuencias de teclas específicas como F1 o Enter. Sin una estrategia de abstracción robusta, el DSL rápidamente se convierte en un desorden de localizadores técnicos y jerga específica del sistema, derrotando su propósito como medio de comunicación entre las partes interesadas comerciales y técnicas.

Además, garantizar una verdadera integridad transaccional a través de estos sistemas distribuidos requiere implementar un patrón de Saga o de Transacción Compensatoria directamente dentro de la arquitectura del marco de prueba, lo cual no es trivial cuando la capa de pruebas carece de ganchos nativos en los protocolos de compromiso de dos fases del mainframe o en los gerentes de transacciones distribuidos. Cuando ocurre una falla en una prueba en el portal web después de que ya se ha comprometido una transacción en el mainframe, el marco debe poseer la inteligencia y la capacidad para activar procedimientos de retroceso explícitos para restaurar la consistencia ambiental. Esto requiere mecanismos sofisticados de seguimiento de estado y manejo de errores que van mucho más allá de los bloques estándar de try-catch.

Finalmente, el marco de automatización debe manejar de manera segura los mecanismos de autenticación dispares sin incrustar credenciales sensibles directamente en los scripts de prueba. Los portales web a menudo utilizan flujos modernos de OAuth2 o SAML con Autenticación Multifactor (MFA), las APIs REST dependen de claves de API o tokens JWT, mientras que los mainframes heredados se autentican contra proveedores RACF o ACF2 utilizando perfiles de usuario estáticos. Un almacén de credenciales centralizado y cifrado con capacidades de inyección específicas del entorno es esencial para mantener una postura de seguridad mientras se permite una autenticación sin interrupciones entre sistemas.

La Solución

Para abordar estas complejidades, el marco debe ser diseñado utilizando el patrón de Arquitectura Hexagonal (Puertos y Adaptadores), que impone una separación estricta entre la lógica del dominio de prueba y las interacciones con sistemas externos. Defina una interfaz de puerto abstracto ApplicationDriver que declare métodos de dominio de alto nivel como enterCustomerData(), verifyAccountCreation() y rollbackTransaction(). Esta interfaz actúa como el único contrato con el que su capa DSL (como Cucumber Step Definitions o SpecFlow Bindings) tiene permitido interactuar, asegurando un aislamiento completo de las especificaciones de implementación.

Las implementaciones concretas de adaptadores manejan las particularidades técnicas específicas del sistema: un SeleniumWebAdapter traduce métodos de puerto en interacciones del navegador, un RestAssuredAdapter ejecuta llamadas HTTP y analiza respuestas JSON, y un HllapiMainframeAdapter utiliza la API de Lenguaje de Alto Nivel para enviar teclas, leer buffers de pantalla y validar contenidos de campo en el emulador 3270. Cada adaptador encapsula su propia lógica de reintento, mecanismos de espera explícita y estrategias de manejo de errores apropiadas a su pila tecnológica. Cuando un adaptador completa con éxito una acción que modifica el estado, publica un evento de dominio (como AccountCreatedEvent) en un TestEventBus central en lugar de devolver tipos de datos primitivos.

Para la integridad transaccional, implemente un Orquestador de Saga de Pruebas que mantenga un registro ordenado de todos los objetos CompensableAction ejecutados durante un escenario de prueba. Si algún paso en el flujo de trabajo falla con una excepción, el orquestador ejecuta automáticamente el método compensate() de las acciones previamente exitosas en orden inverso, ejecutando efectivamente una transacción compensatoria para eliminar la cuenta del mainframe o anular la reserva de API. Este patrón asegura que el entorno de prueba permanezca limpio incluso cuando las pruebas fallan en medio del proceso, previniendo la acumulación de datos huérfanos que plagan las suites de extremo a extremo tradicionales.

La gestión del estado a través de la pila heterogénea se logra tratando el TestContext como un ciudadano de primer nivel, utilizando ThreadLocal<DomainContext> para almacenar objetos de dominio enriquecidos en lugar de cadenas primitivas, evitando así una estrecha acoplamiento entre los pasos de prueba. El adaptador de React podría poblar un objeto CustomerProfile en el contexto, que el adaptador de mainframe posteriormente recupera para ejecutar su parte del flujo de trabajo. Este enfoque asegura que el DSL siga enfocado en entidades comerciales en lugar de identificadores técnicos como IDs de sesión o coordenadas de pantalla.

Para unir estos componentes, utilice un bus de mensajería ligero como Google Guava EventBus o un flujo reactivo para permitir que los adaptadores comuniquen cambios de estado sin invocaciones directas de métodos, desacoplando así el flujo del mainframe del flujo de validación web. Cuando el HllapiMainframeAdapter crea con éxito una cuenta, publica un evento con los detalles de la cuenta, que el SeleniumWebAdapter consume para navegar automáticamente a la pantalla de verificación correspondiente. Este enfoque impulsado por eventos dentro del marco de prueba refleja la moderna arquitectura de microservicios y reduce significativamente la sobrecarga de mantenimiento cuando cambian las interfaces de sistemas individuales.

// Definición de Interfaz de Puerto
public interface BankingDriver {
    void enterCustomerData(Customer customer);
    AccountDetails submitAccountCreation();
    void verifyAccountInPortal(AccountDetails account);
    void rollbackAccountCreation(AccountDetails account);
}

// Adaptador de Mainframe usando HLLAPI
public class MainframeAdapter implements BankingDriver {
    private final HllapiWrapper hllapi;
    private final EventBus eventBus;
    
    @Override
    public AccountDetails submitAccountCreation() {
        hllapi.sendKey("@E"); // Simular la tecla Enter
        waitForScreen("Cuenta Creada");
        String accountId = hllapi.getTextByLabel("Número de Cuenta:");
        AccountDetails details = new AccountDetails(accountId);
        eventBus.post(new AccountCreatedEvent(details));
        return details;
    }
    
    @Override
    public void rollbackAccountCreation(AccountDetails account) {
        hllapi.sendKeys("ELIMINAR " + account.getId());
        hllapi.sendKey("@E");
        verifyScreen("Eliminación Confirmada");
    }
}

// Orquestador Saga para Integridad Transaccional
public class TestSagaOrchestrator {
    private final List<CompensableAction> executedActions = new ArrayList<>();
    
    public void execute(Runnable action, Runnable compensation) {
        try {
            action.run();
            executedActions.add(new CompensableAction(action, compensation));
        } catch (Exception e) {
            compensate();
            throw new TestFailureException(e);
        }
    }
    
    private void compensate() {
        Collections.reverse(executedActions);
        for (CompensableAction action : executedActions) {
            try {
                action.compensate();
            } catch (Exception ex) {
                publishToDeadLetterQueue(action, ex);
            }
        }
    }
}

Situación de la Vida Real

Durante un compromiso de consultoría en 2022 con un proveedor de seguros global que atraviesa una transformación digital, me encontré con un proceso comercial crítico de "Primer Aviso de Pérdida" (FNOL) que ejemplificaba estos retos exactos. El flujo de trabajo requería que un titular de póliza presentara un reclamo a través de una aplicación móvil React Native subiendo fotos del accidente, lo que activó un microservicio de aprendizaje automático basado en Python para la evaluación de daños y detección de fraude, antes de actualizar finalmente un sistema de mainframe Unisys heredado para asignar reservas financieras y validar la cobertura de póliza. La estrategia de automatización existente dependía de tres suites distintas, no comunicantes: Cypress para la aplicación móvil, Pytest para la API, y Jagacy para la emulación del terminal del mainframe.

El enfoque silo requería una correlación manual de números de reclamo entre equipos usando hojas de cálculo compartidas de Excel, y la contaminación ambiental se convirtió en un bloqueo severo durante los ciclos de regresión. El momento de crisis ocurrió cuando un tiempo de espera de la red móvil hizo que una prueba fallara después de que el mainframe ya había comprometido una asignación de reserva de $50,000, dejando los datos financieros en un estado inconsistente que requirió cuatro horas de limpieza manual por parte de un programador de sistemas de mainframe. Este incidente violó directamente la política de "entorno limpio" del equipo y bloqueó el pipeline de CI/CD durante todo un día laborable.

Evaluamos tres posibles estrategias de remediación para prevenir futuras ocurrencias. La primera opción involucraba escribir scripts de limpieza de base de datos posteriores a la prueba para revertir manualmente las transacciones del mainframe, pero esto fue rechazado porque las políticas de seguridad prohibían el acceso SQL directo al entorno de UAT similar a producción. El segundo enfoque proponía implementar un grupo de datos de prueba compartido con mecanismos de bloqueo pesimista para serializar la ejecución de pruebas, pero esto habría aumentado el tiempo de ejecución de la suite de veinte minutos a más de cuatro horas, negando completamente los beneficios de paralelización en CI/CD. La tercera estrategia, que finalmente seleccionamos, implicó implementar un patrón de Saga dentro del propio marco de automatización de pruebas, reflejando el modelo de consistencia eventual de la aplicación mientras preservaba la capacidad de ejecutar cientos de pruebas en paralelo.

La solución implementada introdujo un orquestador ClaimSaga que interceptaba cada acción realizada por los adaptadores móvil y de mainframe. Cuando el adaptador móvil generó una StaleElementReferenceException debido al tiempo de espera de la red, la saga activó inmediatamente la transacción compensatoria reverseReserveAllocation() en el adaptador de mainframe utilizando el ID de reclamo almacenado en el contexto ThreadLocal. Este mecanismo de retroceso automático redujo la contaminación de datos ambientales en un noventa y ocho por ciento y permitió al equipo ejecutar con confianza quinientos hilos paralelos en su pipeline de Jenkins sin temor a crear registros financieros huérfanos.

Esta mejora dramática en la confiabilidad de las pruebas permitió al equipo de QA mover su enfoque de la limpieza manual de datos a pruebas exploratorias y análisis de casos extremos. Los analistas de negocios finalmente pudieron redactar y revisar escenarios de prueba escritos en inglés sencillo, como Dado que un titular de póliza informa de un accidente importante, cuando se suben fotos pero el servicio de evaluación de IA se agota, entonces no se debe asignar ninguna reserva financiera. Esto aseguró que la suite de automatización sirviera como documentación viva y precisa que reflejaba reglas comerciales complejas en los tres niveles tecnológicos.

Lo que a menudo pasan por alto los candidatos

¿Cómo manejas la persistencia del estado de sesión a través del emulador y el portal web sin crear un acoplamiento estrecho entre los adaptadores?

Los candidatos novatos a menudo intentan resolver esto devolviendo identificadores de sesión en bruto o claves primarias de base de datos directamente desde los métodos de definición de pasos, creando dependencias frágiles donde el Paso B no puede ejecutarse hasta que el Paso A haya devuelto explícitamente un valor de cadena específico. Este enfoque rompe fundamentalmente los principios de Diseño Guiado por Dominio y obliga a los pasos Gherkin de fácil lectura de negocios a ordenarse en una secuencia técnica estricta en lugar de un flujo comercial lógico. Además, filtra los detalles de implementación en la capa DSL, haciendo que las pruebas sean frágiles cuando los identificadores técnicos cambian de formato.

La solución arquitectónica robusta implementa un Contexto de Escenario o Contexto de Datos de Prueba que actúa como un registro transitorio durante la ejecución de la prueba, típicamente implementado utilizando ThreadLocal<Map<Class<?>, Object>> para asegurar la seguridad de los hilos durante la ejecución en paralelo. Los adaptadores no devuelven valores primitivos a la capa DSL; en su lugar, publican eventos de dominio o objetos fuertemente tipados en este contexto. Por ejemplo, cuando el adaptador de mainframe crea con éxito una cuenta, publica un AccountCreatedEvent que contiene la entidad completa de la cuenta, que el adaptador web posteriormente recupera al escuchar el bus de eventos o consultar el contexto.

Este enfoque impulsado por eventos asegura que la capa DSL permanezca completamente agnóstica respecto al origen de los datos, ya sea que el número de póliza fue raspado de una pantalla verde o devuelto en una respuesta JSON. Al depender de abstracciones en lugar de implementaciones concretas, el marco se adhiere al Principio de Inversión de Dependencias. Esto permite que los adaptadores individuales sean refactorizados o reemplazados sin afectar los escenarios de prueba legibles para negocios, reduciendo significativamente los costos de mantenimiento a largo plazo.

¿Qué mecanismo específico previene que una transacción compensatoria falle también, potencialmente dejando el sistema en un estado inconsistente?

Muchos ingenieros junior pasan por alto el modo de falla crítico donde la lógica de compensación en sí misma encuentra un error. Tales errores pueden incluir tiempos de espera de red al intentar eliminar un registro del mainframe o fallos de validación porque el registro ya fue modificado por un proceso en segundo plano concurrente. Este escenario resulta en la acumulación de "datos tóxicos" donde la acción original tuvo éxito pero el retroceso falló, dejando el entorno de prueba en un estado permanentemente corrupto.

La solución requiere implementar acciones compensatorias idempotentes que están diseñadas para ser reintentadas de manera segura múltiples veces sin causar errores de eliminación duplicados. Estas deben estar acopladas con un robusto mecanismo de reintento que incluya retroceso exponencial y patrones de cortacircuito para manejar fallos transitorios de infraestructura de manera elegante. Si se agotan todos los intentos de reintento, el marco debe publicar los detalles de la compensación fallida a una Cola de Mensajes No Entregados (DLQ) persistente. Esta DLQ puede implementarse como una tabla de base de datos o un tema de mensajes que contenga IDs de correlación completos y rastros de pila.

Además, implemente puertas de validación antes de intentar la compensación para verificar el estado actual del sistema descendente. Por ejemplo, confirme que la cuenta del mainframe existe, tiene un saldo cero y carece de modificaciones recientes por parte del usuario antes de emitir un comando de eliminación. Un trabajo de reconciliación automatizado nocturno puede procesar entonces la DLQ para manejar manualmente estos registros huérfanos, asegurando que el entorno de prueba se auto-repare y previniendo que regresiones críticas se enmascaren por la contaminación de datos existente.

¿Por qué se considera una responsabilidad utilizar la captura de pantalla basada en coordenadas (HLLAPI) para los mainframes y cómo se abstrae para reducir la sobrecarga de mantenimiento cuando los diseños de pantalla inevitablemente cambian?

Los candidatos a menudo abogan por coordenadas de fila y columna codificadas, como getText(10, 45, 10) para leer diez caracteres que comienzan en la fila diez, columna cuarenta y cinco. Prefieren este enfoque porque parece preciso y determinista durante el desarrollo inicial de la prueba. Sin embargo, esta estrategia crea una carga de mantenimiento severa porque las aplicaciones del mainframe sufren con frecuencia cambios de pantalla donde se insertan nuevos campos, causando que todos los desplazamientos de coordenadas posteriores cambien y desvalidando completas suites de prueba sin previo aviso.

La solución arquitectónica robusta implementa un Modelo de Objeto de Pantalla que mapea nombres de campos lógicos (como ACCOUNT_NUMBER_FIELD) a criterios de búsqueda dinámicos en lugar de coordenadas estáticas. Utiliza las capacidades de Identificación de Campo del emulador de mainframe, disponibles a través de funciones HLLAPI como FindFieldPosition o SearchField, para localizar campos por sus etiquetas asociadas (por ejemplo, buscando el texto "Número de Cuenta:"). En tiempo de ejecución, el adaptador busca en el buffer de pantalla el texto de la etiqueta y calcula el desplazamiento relativo al campo de entrada correspondiente. Cuando cambia el diseño de la pantalla, solo se necesita actualizar el archivo de configuración JSON que mapea etiquetas a desplazamientos, dejando el código Java compilado sin cambios.

Para una mayor resistencia, implemente un mecanismo de Hash de Pantalla o Checksum que capture un hash criptográfico de los contenidos de campo no protegidos al inicio de la interacción. Si el hash no coincide con la línea de base esperada, el marco falla rápidamente con un claro error de "Desajuste de Pantalla" en lugar de intentar leer datos de posiciones incorrectas. Esto evita que las pruebas avancen con datos basura que generarían falsos negativos o positivos, y alerta inmediatamente al equipo de automatización sobre los cambios de pantalla que requieren actualizaciones de configuración.