답변.

질문의 배경

C 언어에서 정수 타입의 산술 연산은 오버플로우를 발생시킬 수 있으며, 이 경우 결과가 타입이 표현할 수 있는 범위를 벗어납니다. 예를 들어, int 또는 unsigned int와 같은 경우입니다. 오버플로우 시의 행동에 대한 규칙은 언어 표준에 따라 달라집니다.

문제

부호가 있는 타입의 오버플로우(signed overflow)는 undefined behavior로 이어지며, 컴파일러는 오류를 무시하거나 예외를 발생시키거나 예측할 수 없는 결과를 남길 수 있습니다. 반면, 부호가 없는 타입(unsigned)에서는 C 표준에 따라 오버플로우가 정의되어 있으며, 타입 크기에 따른 모듈로 연산이 발생합니다(wraparound).

해결책

부호가 없는 숫자에 대한 오버플로우 결과는 예측이 용이합니다. 예를 들면, UINT_MAX + 1 == 0입니다. 부호가 있는 숫자의 경우, 연산 전에 <limits.h>의 매크로를 사용하여 타입의 경계를 확인하는 것이 권장됩니다. 현대의 컴파일러와 도구는 잠재적인 오버플로우를 감지할 수 있습니다.

코드 예시:

#include <stdio.h>
#include <limits.h>

int add_with_check(int a, int b) {
    if (a > 0 && b > INT_MAX - a) {
        printf("오버플로우가 발생합니다!\n");
        return -1;
    }
    return a + b;
}

int main() {
    int x = INT_MAX, y = 1;
    printf("결과: %d\n", add_with_check(x, y));
    unsigned int ux = UINT_MAX;
    printf("Unsigned overflow: %u\n", ux + 1);
    return 0;
}

주요 특징:

부호가 없는 오버플로우는 정의되어 있으며 모듈로에 따라 발생합니다.
부호가 있는 오버플로우는 undefined behavior로, 항상 경계를 확인해야 합니다.
<limits.h>를 사용하여 타입 크기를 가져오세요.

트릭 질문.

부호가 없는 타입의 오버플로우는 오류인가요?

아니요, 이는 표준에 정의된 동작이며 모듈로로 리셋되는 것과 같습니다. 예를 들어, (unsigned int)UINT_MAX + 1 == 0은 항상 참입니다.

int 오버플로우가 발생할 때 결과가 단순히 "INT_MIN"을 넘치는 것에 의존할 수 있나요?

아니요, 그러한 동작은 보장되지 않으며 표준화되지 않았습니다. 이는 undefined behavior일 수 있으며, 프로그램이 크래시되거나 잘못된 값을 반환하거나 컴파일러에 의해 예측할 수 없는 방식으로 최적화될 수 있습니다.

int가 항상 두 보수 형태이며 행동을 예측할 수 있을까요?

현대 하드웨어가 거의 항상 signed int를 두 보수 형태로 표현하지만, C 언어는 이를 표준으로 요구하지 않기 때문에 오버플로우가 발생하는 코드는 이식성이 떨어질 수 있습니다.

일반적인 오류 및 안티 패턴

산술 연산에서 타입 경계 검사를 무시하기
명시적인 변환/검사 없이 signed와 unsigned 간의 비교/변환하기
int가 항상 두 보수 형태라고 가정하기

실제 사례

부정적인 경우

경계 검증 없이 int를 더하는 경우, 큰 데이터에서는 오버플로우가 발생해 유효하지 않은 계산으로 이어질 수 있습니다.

장점:

간단하고 빠른 코드

단점:

극단적인 데이터 세트에서 디버깅하기 어려운 버그 발생
언어 표준 위반

긍정적인 경우

모든 산술 연산 전에 매크로와 함수를 사용하여 오버플로우 체크를 합니다. 오버플로우가 허용되는 곳에서는 unsigned를 사용합니다.