21C세종계획

이러한 국어 정보화 작업은 컴퓨터와 의사소통을 하기 위해서는 컴퓨터에 인간의 언어 능력과 유사한 능력을 부여해 주어야 하고, 컴퓨터가 이해할 수 있는 형태로 언어 정보를 제공해 주어야만 한다. 따라서 컴퓨터가 언어 능력을 갖도록 하기 위해서는 언어의 모든 규칙을 제공하여 주고, 이것을 컴퓨터에서 활용할 수 있도록 하는 제반 작업이 선행되어야 한다. 즉, 인간의 언어 이해와 생성 능력을 컴퓨터에 이식시키려면 대규모의 자료 및 정보(단어, 지식, 문법 체계 등)와 그것들의 정련 단계, 그리고 다양한 언어 현상을 컴퓨터 관련 기술에 반영 하는 과정 등이 필요하다. 결국 국어 정보화란 대규모의 국어 자료와 정보를 구축한 후 이를 바탕으로 컴퓨터가 언어 처리 능력을 가질 수 있게 하고, 이 기술을 21세기 새로운 정보 산업의 총아로 각광받고 있는 자동 번역, 음성 인식 시스템 등의 언어 정보 산업에 응용하는 전 과정을 의미한다. 한편 21세기 지식 정보 사회에서는 정보화 되지 않은 언어는 그 미래를 장담할 수 없으며, 우리만의 정보화를 우리 스스로 이룩해야 한다. 


무려 20년 전에 진행된 국가 프로젝트의 서문입니다.

chatgpt 시대에 다시금 보게되는 글입니다.

github 자료보다가 생각나서 써봅니다.
https://github.com/kakao/khaiii/wiki/%EC%BD%94%ED%8D%BC%EC%8A%A4

1

👉 이 게시글도 읽어보세요