문자 자료형

<aside> 💡

컴퓨터는 0과 1만 표현 가능하므로 문자 역시 컴퓨터 내부에서 표현할 때 0과 1의 조합으로 나타내야 한다. 그래서 문자를 컴퓨터 내부에서 표현하기 위해 특정 정수 값으로 정하자고 약속한 코드 값이 있는데 이 코드 값을 모아둔 것을 ‘문자 세트’이라고 하고 문자를 정해진 코드 값으로 변환하는 것을 ‘문자 인코딩’ 이라고 한다. 반대로 다시 문자로 변환하는 것을 ‘문자 디코딩’ 이라고 한다.

</aside>


자바에서 문자를 표현하기 위한 자료형은 대표적으로 char와 String이 있다. String은 기본형은 아니지만 기본형처럼 사용한다. ex) String str1 = new String(”안녕하세요”); String str2 = “안녕하세요”;

위 두 문장은 출력 값은 같지만 console에 str1 == str2를 출력해보면 false가 나온다.

문자 형은 음수가 없다. 부호 비트가 없기 때문에 0부터 표기한다.

가장 기본이 되는 인코딩 = ASCIIcode —> 1byte

각 언어의 표준 인코딩을 정의해 놓은 것 = unicode


  1. ex) char myChar = ‘A’;
    1. 문자를 변수에 대입하면 문자 그대로 저장되는 것이 아니라 그 문자에 해당하는 정수 값 (ASCII코드) 값이 저장된다.
  2. 프로그램에서 문자를 사용 할 때는 항상 작은 따옴표(’ ‘) 사용한다. 문자열은 (” “)