Ответ на вопрос.

История вопроса: В инициативах модернизации предприятий аналитики бизнеса часто сталкиваются с устареванием знаний — явлением, при котором критическая бизнес-логика сохраняется только в нечитаемом устаревшем коде. Этот вопрос возник в ходе миграций с мейнфреймов на облако, когда оригинальные архитекторы ушли на пенсию десятилетия назад, оставив после себя COBOL программы, которые работают идеально, но не поддаются интерпретации. Исторический контекст включает переход от монолитной пакетной обработки к распределенным микросервисам, где неявное управление состоянием должно стать явными API контрактами.

Проблема заключается в эпистемической непрозрачности: система работает, но никто не знает, почему. База кода COBOL содержит неявные бизнес-правила — крайние случаи, регуляторные исправления и ручные переопределения, которые никогда не были задокументированы, поскольку оригинальные разработчики держали их в памяти. Текущий операционный персонал понимает входы и выходы, но не логику принятия решений. Между тем новая облачная архитектура требует, чтобы эти правила были декомпозированы, задокументированы и доступны через REST конечные точки для реального времени. Фиксированный регуляторный срок не позволяет проводить многолетние археологические исследования, однако ошибки в извлечении правил могут нарушить требования по обработке данных GDPR или точности финансовой отчетности.

Решение использует подход треугольного реверс-инжиниринга. Сначала проводятся мастерские Event Storming с операционным персоналом для отображения наблюдаемых бизнес-поведения и идентификации "черных ящиков" процессов. Во-вторых, используются инструменты статического анализа кода для генерации графиков управления потоком программ COBOL, перекрестно ссылаясь на мутации переменных с бизнес-результатами. В-третьих, реализуется режим параллельного запуска, где новые микросервисные процессы повторяют транзакции по сравнению с устаревшей системой без воздействия на производительность, фиксируя несоответствия для расследования. Это создает обратную связь, где археология кода подтверждает воспоминания заинтересованных сторон, а контекст заинтересованных сторон объясняет аномалии кода.

Ситуация из жизни

Региональная страховая компания нуждалась в замене устаревшего двигателя рейтингования полисов COBOL 1980-х на набор микросервисов на Python/FastAPI для обеспечения распределенных мобильных котировок в реальном времени. Оригинальная логика расчета включала сложные весовые коэффициенты территориального риска, сезонные корректирующие факторы и положения о перестраховании, которые были добавлены на протяжении более сорока лет. Трое оставшихся разработчиков COBOL ушли на пенсию, а текущий ИТ-персонал рассматривал систему как "магическую коробку", которая производила правильные премии, но не могла объяснить математические выводы для конкретных крайних случаев. Регулирующий орган потребовал завершения миграции в течение восьми месяцев, чтобы избежать штрафов за неподдерживаемую инфраструктуру.

Было оценено несколько подходов для захвата требований. Первый вариант предложил транскрипцию кода в спецификацию, где разработчики вручную задокументируют каждое IF выражение и MOVE операцию в исходном COBOL. Плюсы включали теоретическую полноту и сохранение точной логики. Минусы были значительными: база кода содержала более двух миллионов строк спагетти-кода с недокументированными глобальными переменными, что сделало бы это многолетним усилием, которое пропустило бы срок и, вероятно, привело бы к ошибкам транскрипции.

Второй вариант предполагал вывод требований из черного ящика, наблюдая за входами (атрибутами полиса) и выходами (суммами премий), чтобы вывести правила посредством статистической регрессии. Плюсы заключались в скорости и фокусе на текущей бизнес-ценности, а не на техническом долге. Минусы включали неспособность обнаружить спящие пути кода для редких случаев требований и риск кодификации ошибок как функций.

Третий вариант, поведенческая археология с параллельной проверкой, включал извлечение образцов данных из пяти лет производственных журналов, построение деревьев решений на основе фактических транзакций и валидацию этих данных против исходного кода COBOL с использованием инструментов автоматического сравнения.

Команда выбрала третье решение, потому что оно уравновесило скорость с точностью, соблюдая принцип гибкой методологии о работающем программном обеспечении, а не о всесторонней документации. Сосредоточившись на выполненных путях кода, а не на мертвых функциях, они сократили объем работы на 60%, гарантируя, что активные бизнес-правила были правильно зафиксированы. Они создали data lake, содержащий анонимизированные исторические транзакции, и проводили их как через устаревшие JCL задания, так и через новые FastAPI сервисы, автоматически фиксируя несоответствия в расчетах премий более 0,01%. Это выявило три критически важные недокументированные условия: переопределение франшизы по ураганам для полисов Флориды, выданных до 1992 года, специальное расчёт комиссии для вышедших на пенсию агентов и ошибка округления в квартальной налоговой отчетности, которая была "исправлена" ручными расчетами в таблицах на протяжении десятилетий. Микросервисы были переработаны, чтобы явно обрабатывать эти крайние случаи в качестве настраиваемых бизнес-правил, а не жестко закодированных констант.

Что часто упускают кандидаты

При реверс-инжиниринге устаревшего кода, как вы различаете критические бизнес-ограничения и технические решения, которые можно безопасно исключить во время миграции?

Кандидаты часто предполагают, что вся существующая логика служит текущей бизнес-цели, попадая в ловушку потерь в затратах на сохранение унаследованного. Правильный подход включает анализ временного контекста: изучение временных меток изменений кода для корреляции с известными регуляторными изменениями, слияниями или технологическими ограничениями, которые больше не существуют. Например, процедура усечения данных в COBOL может существовать исключительно потому, что первоначальная схема DB2 использовала фиксированные поля, тогда как современные PostgreSQL поддерживают строки переменной длины, что полностью исключает необходимость в правиле усечения. BAs должны проводить сессии проверки намерений с бизнес-участниками, представляя предполагаемые обходные решения в виде "Мы можем упростить это, убрав X; повлияет ли это на вашу соответствие?", а не спрашивать "Должны ли мы сохранить X?" Это смещает бремя доказательства на необходимость, а не на сохранение.

Как вы предотвращаете антишаблон "культа груза", когда новая система копирует неэффективные пакетные потоки просто потому, что они существуют в монолите COBOL?

Многие кандидаты сосредоточиваются исключительно на функциональном паритете без реинжиниринга процессов. Провал происходит, когда BAs документируют текущее состояние (например, "Система запускает ночной пакет в 2 AM") как требование для будущего состояния, игнорируя то, что событийно-ориентированные архитектуры с использованием Apache Kafka или RabbitMQ могут предоставить возможность обработки данных в реальном времени. Решение требует картирования возможностей: отделив "что" (расчет риска должен осуществляться) от "как" (пакет против потока). BAs должны проводить картирование потоков ценности, чтобы определить время ожидания в графике пакетной обработки, который служил оперативным удобством, а не бизнес-правилам. Доказывая, что REST конечные точки могут предоставить немедленную обратную связь подателям заявок, сокращая время от котировки до подписания с 24 часов до 30 секунд, они обосновывают архитектурные изменения, которые в противном случае были бы отклонены как "слишком отличающиеся от старой системы."

Какова ваша методология для количественного определения и коммуникации рисков "неизвестных неизвестных" — неявных правил, которые никогда не проявлялись в вашем периоде наблюдения, но могут проявиться катастрофически после миграции?

Кандидаты часто представляют заинтересованным сторонам ложную уверенность, основываясь на 100% показателях прохождения тестов по историческим данным. Сложный ответ признает смещение выборки в устаревших данных и выступает за стресс-тестирование с использованием синтетических сценариев. Это включает генерацию фуззированных входных данных, которые проверяют граничные условия, не видимые в производственных журналах, а затем сравнение выходных данных COBOL и новой системы. Кроме того, BAs должны установить шаблон предохранителя в новой архитектуре: если микросервис сталкивается со структурой транзакции, которую он не может обработать (указывает на потенциальное упущенное правило), он должен элегантно перейти к вызову устаревшей обертки SOAP (если она доступна) или пометить для человеческой проверки, вместо того чтобы молча завершить выполнение или возвращать нулевые значения. Стратегия коммуникации включает вероятностные матрицы рисков, показывающие, что хотя 95% правил были валидированы, оставшиеся 5% неопределенности требуют трехмесячного периода гиперконтроля с удвоенной проверкой вручную.