리메이크 중/C,C++ 이론 중심

C(&C++) 이론 11. char형

라이피 (Lypi) 2021. 6. 2. 23:00
반응형


내용 참고

Microsoft Docs (구 MSDN)

영문 wikipedia


C언어 이론 11 / 그 외 기본 타입들 (1)

■ 이번 포스트에서는 정수형과 실수형을 제외한 char, bool 타입에 대해서 다룬다.

Ⅰ. 문자형

ⅰ. char

■ char는 하나의 문자를 저장하는 타입이다.

■ 내부적으로는 정수형 타입과 동일하게 작동하는 1byte 자료형과 같다.

■ char형 또한 signed char와 unsigned char로 구분될 수 있다.

■ 기본적으로 char형은 signed char형과 동일하게 처리된다.

■ 그러므로 char형 변수는 내부적으로 -128~127까지의 정수를 저장할 수 있다. 

■ char형 변수는 기본적으로 아스키 코드표에 따라 0~127까지의 수를 문자와 일대일 대응하여 표시한다. 

■ 이러한 일대일 대응은 프로그램의 문자 인코딩 환경에 따라 달라질 수 있다.

■ 아스키 코드는 7비트만을 사용하는 것으로 나머지 1비트는 오류 검출용 비트 (패리티(parity) 비트)로 사용했었다.

■ 기본적으로 아스키 코드로 -1~-128까지의 수를 문자로 나타내려 하면 물음표 등으로 표시된다.

■ 이는 문자 인코딩 환경에 따라 달라질 수 있다.

 

ⅱ. ASCII(American Standard Code for Information Interchange)

■ 92번의 역슬래시는 EUC-KR에서는 ₩, Shift-JIS에서는 ¥로 표시된다. 

■ 0~8, 14~31, 127번 문자는 제어문자로 화면 상에 문자로 표시되지 않고 각각의 특수한 역할을 수행한다.

■ 아스키코드는 대부분의 시스템에 적용될 수 있다는 장점이 있어서 간단한 시스템에서는 자주 사용된다.

■ 하지만 표현할 수 있는 문자수의 문제로 국제 표준으로 지정되지는 않았다.

■ 국제 표준은 문자에 따라 다른 바이트를 할당하는 방식인 유니코드이다.

■ 유니코드의 1바이트 영역은 아스키코드와 호환된다.

 


 

반응형