정보에 대한 몇 가지 생각 정리. 아직은 생각에 머물러 있는 단계이고, 차후에 이것들에 대해 보다 엄밀한 정의와 연산이 가능해지면 새로운 글을 써 볼 예정.

용어에 혼선이 올 수 있으므로 이 글에서 용어는 다음과 같이 정의한다.

  1. Data: 정보가 될 수 있는 물리량
  2. 정보: Data 중에 해석 된 것들
  3. 해석 체계: Data를 정보로, 정보를 다시 Data로 변환하는 체계

Data는 물리량이다

Data는 소프트웨어적인 개념으로 생각되지만, 실제 Data는 하드웨어이다. 예컨대 이 문서에 쓰인 글자는 사실 컴퓨터 메모리 상에 실제 물리적으로 기록이 되어 있는 것이고, 종이에 쓰여진 글자 또한 잉크가 물리적으로 존재하는 것이다.

생명의 정보인 DNA도 아데닌(A), 티민(T), 구아닌(G), 사이토신(C)이라는 분자 구조로 이루어진 것이며, 우리가 머리 속에서 하는 모든 생각도 뉴런에 저장되어 있는 단백질에 기반한 것이다.

소리는 앞선 예과 달리 파동이지만 여하튼 그것 조차 물리적으로 존재하는 것이다.

다시 말해 우리는 어딘가에 입자 형태건 파동 형태건 물리적으로 존재 하지 않는 것을 Data로서 처리할 수 없다. —이 말을 뒤집어 생각해 보면 물리적으로 존재하는 모든 것을 Data로서 처리할 수 있다고 생각 할 수 있다.

정보는 해석 체계에 기반한다

Data는 물리량이지만 정보는 소프트웨어라고 생각할 수 있는데, 이는 해석 체계가 소프트웨어이기 때문이다.

Data을 적절히 해석해 내는 체계가 없으면 그것은 정보가 될 수 없다. 예컨대 나에게 아랍어로 된 문자는 내가 아랍어에 대한 해석 체계가 없기 때문에 정보가 되지 못한다.

정보는 사용 된 후 어딘가에 Data로 —물리적으로— 저장될 수 있고, 추후에 다시 꺼내 쓸 수 있는데, 그 저장과 인출을 해석 체계의 암호화와 복호화라고 할 수 있다. 종이에 쓰여진 아랍어는 결국 암호화된 Data인데, 아랍어를 복호화 할 수 없는 사람에게는 그것이 말 그대로 암호인 것이다.

해석 체계는 결국 Data를 정보로 변환하고, 정보를 Data로 변환하는 알고리즘이라 할 수 있다. 물론 이 변환 알고리즘이 해석 체계의 전부는 아니다.

정보는 정보로부터 재귀적으로 생성될 수 있다

정보가 해석된 Data라고 하면 마치 정보가 Data의 부분일 것으로 생각 되지만, 그렇게 만들어진 정보가 조합되어 새로운 정보를 생성할 수 있기 때문에 정보는 Data의 부분이 아니다.

흔히 창발(emergence)의 예로 온도를 많이 드는데, 개별 입자에는 존재하지 않는 온도 —입자들 운동의 평균값— 라는 속성이 입자 전체 수준에서 나타난다는 것이다. 이는 개별 요소와 그 요소들의 집합의 차이에서 나타나는 현상인데, 개별 요소들에는 자신을 포함한 요소들 전체 합이나 평균 같은 것을 알 수 없지만, 요소들을 하나의 집합으로 묶으면 그 집합에 대하여 전체 합이나 평균 같은 것을 정의할 수 있기 때문에 일어나는 것이다.

집합이라는 것은 사실 물리적으로 존재하는 것이 아니라 개별 요소가 가진 정보를 기반으로 새롭게 정의된 개념이기 때문에 이와 같은 것이 가능한 것이다. 이것은 결국 어떤 정보로부터 새로운 정보가 생성될 수 있다는 것이고 이렇게 생성된 정보는 또 새로운 정보를 생성할 수 있게 되는데, 이 과정은 재귀적으로 무한 반복 가능하다.

이런 정보의 재귀적 생성도 해석 체계에서 일어나는 일이다. 재귀적으로 생성된 정보는 암호화 되어 어딘가에 Data로 —물리적으로— 저장되고, 그것을 다시 해석 체계가 복호화해서 정보로 사용한다.