박형익·경기대학교 교수
1. 머리말
21세기 세종 계획을 수립할 당시 우리의 언어 정보화 환경은 아주 열악하였음에도 불구하고 컴퓨터를 이용하여 한국어를 바르게 사용하는 데에 도움을 주고자 한민족 언어 정보화 사업을 추진하게 되었다. 21세기 세종 계획의 한 분과였던 한민족 언어 정보화의 사업은 1998년부터 2007년까지 10년 동안 진행되었다. 이 사업에는 130명의 연구원과 276명의 보조 연구원 그리고 4명의 보조원 등 모두 410명이 참여하였다. 그리하여 13권의 연구 보고서를 발간하였으며, 사업을 진행하면서 개발한 16개의 프로그램을 1개의 프로그램으로 통합하여 우리의 다양한 언어 정보를 인터넷에서 빠르고 손쉽게 검색할 수 있는 성과를 거두었다.
여기에서는 한민족 언어 정보화의 성과를 간략하게 소개한 다음 이 과제를 추진하면서 도출되었던 문제점들을 정리하고자 한다. 그런 다음 앞으로 우리가 준비해야 할 사항들도 점검해 보기로 한다.
2. 수행한 세부 사업의 목록
한민족 언어 정보화의 제1단계 사업은 1998년부터 2000년까지, 제2단계 사업은 2001년부터 2003년까지, 제3단계 사업은 2004년부터 2007년까지 실행하였다. 이 10년 동안에 이루어진 한민족 언어 정보화의 세부 사업을 연도별로 소개하면 다음과 같다.
(1) |
1998년: 한글 맞춤법 검색 시스템, 남북한 언어 비교 사전(1) |
(2) |
1999년: 표준어 검색 시스템, 남북한 언어 비교 사전(2), 외래어 표기법 검색 시스템 구축을 위한 기초 조사, 언어 규범 검색 통합 프로그램(1) |
(3) |
2000년: 외래어 표기법 검색 시스템 개발, 한국 방언 검색 시스템 개발을 위한 기초 조사, 남북한 언어 비교 사전 구축(3), 한민족 언어 정보화 통합 검색 프로그램(2) |
(4) |
2001년: 남한 방언 검색 시스템 개발, 국어 로마자 표기법 검색 시 스템 개발, 국어의 로마자 표기 변환 프로그램 개발, 남북한 이질 화된 언어 검색 시스템 개발, 한민족 언어 통일을 위한 검색 통합 프로그램1 개발(3) |
(5) |
2002년: 한민족 정서법 변환 프로그램 개발을 위한 기초 연구(1), 북한 방언 검색 시스템 개발, 어휘 역사 검색 시스템 개발1(1), 한 민족 언어 통일을 위한 검색 통합 프로그램2 개발(4) |
(6) |
2003년: 한민족 정서법 변환 프로그램 개발을 위한 기초 연구(2), 중국 및 기타 지역 방언 검색 시스템 개발을 위한 기초 연구, 국어 어휘 역사 검색 시스템 개발(2)을 위한 기초 연구(2), 한민족 언어 정보 검색 통합 프로그램 개발(5) |
(7) |
2004년: 한국 전통 문화 어휘 검색 프로그램 개발을 위한 기초 연 구, 문학 작품에서 사용된 방언 검색 프로그램 개발을 위한 기초 연구(1), 국어 어휘 역사 검색 시스템 개발(3)을 위한 기초 연구 (3), 한민족 언어 정보 검색 통합 프로그램 개발(6) |
(8) |
2005년: 문학 작품에서 사용된 방언 검색 프로그램 개발을 위한 기초 연구(2), 국어 어휘의 역사 검색 시스템 개발(4)을 위한 기초 연구(4), 한민족 언어 정보 검색 통합 프로그램 개발(7) |
(9) |
2006년: 문학 작품에서 사용된 방언 검색 프로그램(3), 국어 어휘 의 역사 검색 프로그램 개발(5)을 위한 기초 연구(5), 한민족 언어 정보 검색 통합 프로그램 개발(8) |
(10) |
2007년: 남북한 언어 비교 사전 및 한국 방언 검색 프로그램의 정제, 국어 어문 규정 검색 프로그램의 정제, 국어 어휘의 역사 검색 프로그램의 정제, 한민족 언어 정보 검색 통합 프로그램 개 발(9) |
3. 세부 과제의 내용
위에 열거한 과제들의 내용을 수행한 차례대로 간략하게 설명해 보기로 한다.
(1998-1) 한글 맞춤법 검색 시스템
한글 맞춤법 규정 원문과 해설을 컴퓨터를 이용하여 찾아볼 수 있도록 입력 형식을 정하여 자료를 작성하였다. 사용자가 검색어를 입력하면 해당 규정에 관한 설명과 올바른 용례를 찾아볼 수 있도록 하였다. 24,812개의 검색어와 11,628개 표제항에 관한 내용을 찾아볼 수 있다.
(1998-2) 남북한 언어 비교 사전(1)
기초 어휘 1,000개를 선정하여 남북한 언어 비교 사전을 만들었다. 각 어휘에 관한 남북한 사전에 기술되어 있는 표기, 발음, 문법, 의미 및 기타 정보의 차이점을 조사하고 그 원인을 검토하였다.
(1999-1) 표준어 검색 시스템
표준어 규정 원문과 해설을 컴퓨터로 검색할 수 있도록 입력 구조를 정해 자료를 작성하였다. 검색어를 입력하면 표준어와 비표준어를 구분할 수 있도록 하였는데, 18,174개의 검색어와 7,046개 표제항에 관한 예문과 기타 여러 내용을 찾아볼 수 있도록 하였다.
(1999-2) 남북한 언어 비교 사전(2)
4,000개의 어휘를 선정하여 기존의 대표적인 남북한 국어 대사전에서 기술한 표기, 음운, 문법, 의미 기타 여러 정보들을 비교하여 차이점과 공통점을 찾아내었다. 그리하여 그 결과를 남북한 언어 비교 사전 검색기를 통하여 검색할 수 있도록 하였다.
(1999-3) 외래어 표기법 검색 시스템 구축을 위한 기초 조사
프로그램을 개발하기 위해 선정한 24,362개의 외래어와 관련 내용을 일정한 형식에 맞추어 입력하였다. 외래어 표기법의 원문과 해설의 내용을 검색하고 어떤 외래어의 표기가 바른지 확인할 수 있도록 작업하였다.
(1999-4) 언어 규범 검색 통합 프로그램(1)
한글 맞춤법과 표준어 규정이 포함되어 있는 어문 규범 검색 시스템과 남북한 언어 비교 사전 검색기를 통합하여 검색창에 하나의 검색어를 입력하면 여러 가지 관련 정보들을 동시에 찾아볼 수 있도록 프로그램을 통합하여 개발하였다.
(2000-1) 외래어 표기법 검색 시스템 개발
외래어 표기법 검색 시스템의 기초 작업의 결과를 컴퓨터에서 검색할 수 있도록 작업하였다.
『표준국어대사전』에 수록된 외래어와 기타 여러 자료에서 찾은 외래어를 수집하여 추가하였다. 82,731개의 검색어와 25,520개 표제항에 관한 내용을 검색 프로그램에서 찾아볼 수 있도록 하였다.
(2000-2) 한국 방언 검색 시스템 개발을 위한 기초 조사
『표준국어대사전』, 『우리말 큰사전(한글학회)』,
『금성판 국어 대사전』 등에 수록된 방언뿐만 아니라 지금까지 간행된 방언 사전과 방언 자료집, 그리고 남북한, 중국 연변 등의 방언 자료를 수집하고, 그 신뢰성을 조사하여 입력하였다. 그리하여 표준어를 입력하여 검색하면 각 지역의 방언형을 찾아볼 수 있도록 하였으며, 방언형을 입력하여 검색하면 표준어와 다른 지역의 방언형들을 찾아볼 수 있도록 하였다.
(2000-3) 남북한 언어 비교 사전 구축(3)
남북한의 10,000개의 기초 어휘를 선정하여 『표준국어대사전』,
『금성판 국어대사전』, 『조선말대사전』 등 남북한 사전에서 차이점과 공통점을 찾아 기술하였다. 사전에서 찾은 표기, 발음, 문법, 의미, 기타 사항 등의 정보들을 비교한 내용을 컴퓨터에서 검색할 수 있도록 입력하였다.
(2000-4) 한민족 언어 정보화 통합 검색 프로그램(2)
한글 맞춤법과 표준어 규정이 포함된 어문 규정 검색 통합 시스템에 외래어 표기법 검색 시스템을 추가하였다. 그리고 남북한 언어 비교 사전의 추가 연구를 통합하여 검색할 수 있도록 프로그램을 개발하였다.
(2001-1) 남한 방언 검색 시스템 개발
2000년도에 연구한 기초 자료를 중심으로 남한의 방언을 검색하는 프로그램을 개발하였다. 그리하여 표준어 19,432개를 선정하여 여기에 해당하는 방언형 157,876개와 이 방언형들이 사용되는 지역을 프로그램을 통하여 찾아볼 수 있도록 입력하였다.
(2001-2) 국어 로마자 표기법 검색 시스템 개발
2000년에 개정된 국어의 로마자 표기법의 원문과 해설의 내용을 검색할 수 있도록 자료를 작성하였다. 그리고 검색어를 입력하면 바른 표기와 틀린 표기의 예들을 찾아볼 수 있도록 하였으며, 관련 조항도 찾아볼 수 있도록 하였다. 모두 11,180개의 표제항을 검색할 수 있다.
(2001-3) 국어의 로마자 표기 변환 프로그램 개발
한국어 단어를 한글로 입력하여 로마자로 자동으로 변환시키는 프로그램과 로마자로 입력하여 한글로 자동으로 변환시킬 수 있는 프로그램을 개발하였다. 전자는 국어의 로마자 표기법에 의한 자동 변환 프로그램이고, 후자는 국어의 로마자 표기법 제8항에 따라 한글 복원을 전제로 할 때에 필요한 전자법을 적용한 자동 변환 프로그램이다.
(2001-4) 남북한 이질화된 언어 검색 시스템 개발
남한에서는 쓰이지 않고 북한에서만 사용하는 어휘 가운데 빈도가 높은 3,076개 어휘를 선정하여 표기, 발음, 문법, 의미, 기타 사항으로 나누어 비교한 내용을 일정한 구조를 정하여 입력하였다. 어휘의 생성 배경, 연어 정보 등을 제시하였으며, 대응하는 남한의 어휘나 표현을 찾아볼 수 있도록 하였다.
(2001-5) 한민족 언어 통일을 위한 검색 통합 프로그램1 개발(3)
한글 맞춤법, 표준어 규정, 외래어 표기법, 국어의 로마자 표기법 등의 4가지 프로그램을 통합한 국어 어문 규정 검색 프로그램 그리고 남북한 언어 비교 사전 검색 프로그램, 남북한 이질화된 언어 검색 프로그램, 남한 방언 검색 프로그램을 모두 통합하여 손쉽게 검색할 수 있도록 프로그램을 개발하였다.
(2002-1) 한민족 정서법 변환 프로그램 개발을 위한 기초 연구(1)
한글로 적은 북한의 자료들을 남한의 정서법으로 변환시키는 프로그램을 개발하였다. 북한 정보를 손쉽게 검색하여 그 내용을 정확하게 이해하는 데에 도움이 될 수 있도록 프로그램을 만들었다. 변환할 수 있는 자료는 21세기 세종 계획 특수 자료 구축 분과에서 2001년까지 구축한 북한 말뭉치로 제한하였다. 남북한 정서법 변환 엔진을 개발하였으며, 엔진에 필요한 대역어 사전을 구축하였고, 북한-남한 코드 변환기와 엔진을 개발하였다.
(2002-2) 북한 방언 검색 시스템 개발
북한의 함북, 함남, 평북, 평남, 황해, 강원도 미수복 지역 5개 군, 경기도 미수복 지역 2개 군에서 사용하는 방언을 검색할 수 있는 시스템을 개발하였다. 그리하여 방언량이 풍부한 표준어 12,266개를 선정하여 여기에 해당하는 방언형 38,027개와 그 방언형들을 사용하는 지역을 프로그램을 통하여 볼 수 있도록 하였다.
(2002-3) 어휘의 역사 검색 시스템 개발1(1)
1,016개의 현대 한국어 일상 어휘를 선택하였으며, 그 어휘들의 어원 정보, 표기와 형태 변화, 음운 변화, 의미 변화의 과정을 실증적인 자료를 제시하여 설명한 내용을 입력하였다. 그리고 21세기 세종 말뭉치를 세기별로 검색하여 추출한 용례를 입력하였다.
(2002-4) 한민족 언어 통일을 위한 검색 통합 프로그램2 개발(4)
한글 맞춤법, 표준어 규정, 외래어 표기법, 국어의 로마자 표기법을 합쳐 국어 어문 규정 검색 프로그램으로 개발하였다. 그리고 이것과 더불어 남북한 언어 비교 사전, 남북한 이질화된 언어 검색 프로그램, 남한 방언 검색 시스템, 북한 방언 검색 프로그램, 국어 어휘의 역사 검색 프로그램, 남북한 정서법 변환 프로그램을 모두 통합하여 검색할 수 있도록 프로그램을 개발하였다.
(2003-1) 한민족 정서법 변환 프로그램 개발을 위한 기초 연구(2)
남한어를 북한어로 자동으로 변환할 수 있는 프로그램과 남한-북한 코드 변환 프로그램을 개발하기 위한 기초 연구를 수행하였다. 그리고 남북한어 변환 프로그램을 하나의 변환 프로그램으로 통합하여 남북한어 변환 프로그램을 개발하였는데, 이 프로그램 개발에 사용한 남북한어 대역 사전의 표제어는 73,926개이다.
(2003-2) 중국 및 기타 지역 방언 검색 프로그램 개발을 위한 기초 연구
중국의 헤이룽장 성(흑룡강성), 길림성, 요령성 등 동북 3성에서 조사한 방언 자료를 수집하여 정리하고, 중앙아시아 지역의 방언 자료를 수집하여 정리하였다. 그리하여 2,000개 방언을 검색할 수 있는 프로그램을 만들기 위하여 일정한 구조를 정해 조사한 내용을 입력하였다.
(2003-3) 국어 어휘의 역사 검색 시스템 개발(2)를 위한 기초 연구(2)
15세기부터 20세기에 이르기까지 1,037개 어휘의 형태, 음운, 의미 등의 변화를 쉽게 기술하였다. 용례는 세종 말뭉치에서 세기별로 검색하여 수록하였다. 그리하여 컴퓨터에서 국어 어휘의 역사 정보를 빠르고 정확하게 이해할 수 있도록 조사한 내용을 입력하였다.
(2003-4) 한민족 언어 정보 검색 통합 프로그램 개발(5)
2002년에 개발한 ‘국어 어휘의 역사 검색 프로그램’의 자료와 인터페이스를 보완하여 더욱 많은 어휘를 편리하게 검색할 수 있는 사용자 환경을 구축하였다. 그리고 남한 방언 검색 시스템, 북한 방언 검색 시스템, 해외 방언 검색 시스템을 개발함으로써 한국 방언을 전체적으로 검색할 수 있는 프로그램을 완성하였다.
(2004-1) 문학 작품에서 사용된 방언 검색 프로그램 개발을 위한 기초 연구(1)
각 도의 방언이 수록된 문학 작품의 말뭉치를 구축하여 적절한 방언을 선정하였다. 그리고 선정한 방언의 용례를 찾아 방언의 의미를 기술하고 종합적인 해설을 덧붙였다. 그리하여 프로그램을 만들 수 있도록 정한 형식 구조에 조사한 내용을 입력하였다.
(2004-2) 국어 어휘의 역사 검색 시스템 개발(3)을 위한 기초 연구(3)
15세기부터 20세기에 이르기까지 1,071개 어휘의 어원 정보와 어휘 역사를 기술하였다. 21세기 세종 계획에서 구축한 말뭉치를 세기별로 검색하여 용례를 추출하였으며, 어휘의 형태 변화, 음운 변화, 의미 변화 등을 설명하였다. 이렇게 조사한 내용을 프로그램으로 만들기 위해 일정한 형식 구조에 입력하였다.
(2004-3) 한국 전통 문화 어휘 검색 프로그램 개발을 위한 기초 연구
수집한 한국 전통 문화 어휘 중에서 1,500개를 선정하였다. 그런 다음 1,500개 어휘 중에서 300개 어휘의 언어와 문화에 관한 정보를 기술하였다. 그리고 이 정보에 용례, 참고 항목, 그림, 사진 등도 첨가하여 컴퓨터에서 검색할 수 있도록 일정한 형식 구조에 입력하였다.
(2004-4) 한민족 언어 정보 검색 통합 프로그램 개발(6)
국어 어휘의 역사 검색 프로그램, 한국 전통 문화 어휘 검색 프로그램, 문학 작품에서 사용된 방언 검색 프로그램을 인터넷에서 검색할 수 있는 웹 검색 프로그램을 개발하였다. 그리고 국어 어문 규정 검색 프로그램, 남북한 언어 비교 사전 검색 프로그램, 남북한 이질화된 언어 검색 프로그램, 한국 방언 검색 프로그램도 함께 통합하였다.
(2005-1) 문학 작품에서 사용된 방언 검색 프로그램 개발을 위한 기초 연구(2)
방언이 많이 사용된 시, 소설, 구비 문학, 희곡 등의 문학 작품에 나타나는 지역을 대표하는 700개의 방언을 수집하였다. 그리고 이 방언들의 의미와 용례를 조사한 내용을 검색 프로그램을 만들 수 있도록 일정한 형식 구조에 입력하였다.
(2005-2) 국어 어휘의 역사 검색 시스템 개발(4)를 위한 기초 연구(4)
1,066개 어휘에 관한 15세기에서 20세기까지의 역사 정보를 검색할 수 있도록 어휘의 형태 변화, 음운 변화, 의미 변화 등에 관한 내용을 조사하였다. 그리하여 조사한 한국어 어휘의 어원 정보와 역사 정보를 인터넷을 활용하여 찾아볼 수 있도록 일정한 형식 구조에 입력하였다.
(2005-3) 한민족 언어 정보 검색 통합 프로그램 개발(7)
국어 어휘의 역사 검색 프로그램과 문학 작품에서 사용된 방언 검색 프로그램을 인터넷에서 검색할 수 있도록 웹 검색 프로그램을 개발하였다. 그리고 국어 어문 규정 검색 프로그램 등 이전에 개발한 프로그램들과 통합하여 하나의 검색어에 관한 다양한 언어 정보를 검색할 수 있도록 하였다.
(2006-1) 문학 작품에서 사용된 방언 검색 프로그램 개발을 위한 기초 연구(3)
방언이 많이 사용된 시, 소설, 구비 문학, 희곡 등의 문학 작품에 나타나는 지역을 대표하는 방언과
『한국 구비문학 대계』와 『한국 방언 자료집』에서 수집한 방언 700개를 선택하였다. 그리하여 이 방언들의 이형태, 의미, 용례 등을 조사한 내용을 프로그램에서 검색할 수 있도록 일정한 형식 구조에 입력하였다.
(2006-2) 국어 어휘의 역사 검색 시스템 개발(5)를 위한 기초 연구(7)
1,005개의 어휘에 관한 15세기에서 20세기까지의 역사 정보 즉 어휘의 형태 변화, 음운 변화, 의미 변화 등에 관한 내용을 조사하였다. 그리하여 한국어 어휘의 어원 정보와 역사 정보를 인터넷을 활용하여 찾아볼 수 있도록 조사한 내용을 일정한 형식 구조에 입력하였다.
(2006-3) 한민족 언어 정보 검색 통합 프로그램 개발(8)
국어 어휘의 역사 검색 프로그램과 문학 작품에서 사용된 방언 검색 프로그램을 인터넷에서 검색할 수 있는 웹 검색 프로그램으로 개발하였다. 그리고 국어 어문 규정 검색 프로그램 등 이전에 개발한 프로그램들과 통합하여 검색어에 관한 다양한 언어 정보를 찾아볼 수 있도록 하였다.
(2007-1) 남북한 언어 비교 사전 및 한국 방언 검색 프로그램의 정제
남북한 언어 비교 사전에서 기술한 어휘 중에서 2,000개 표제어의 표기, 발음, 문법, 의미 등에 관한 내용을
『조선말대사전』, 『조선어사전』, 그리고
『겨레말큰사전』의 편찬을 위해 개발한 ‘통합 사전 검색기’ 등을 이용하여 정제하고 교정하였다. 그리고 문학 작품에 나타난 방언 검색 프로그램에서 2,000개 표제어의 표준어와 방언, 품사 정보, 뜻풀이 정보, 관련 지역 정보, 예문, 종합 설명 등에 관한 내용의 적절성을 확인하였다.
(2007-2) 국어 어문 규정 검색 프로그램의 정제
국어 어문 규정 검색 프로그램에는 표제어 54,245개에 관한 내용이 기술되어 있다. 이중에서 한글 맞춤법, 표준어 규정, 외래어 표기법, 국어의 로마자 표기법의 각 표제어 2,000개에 관한 내용을 정제하였다.
(2007-3) 국어 어휘의 역사 검색 프로그램의 정제
개발한 국어 어휘의 역사 검색 프로그램에 포함된 5,195개 어휘 중에서 2,000개 어휘를 선정하여 이미 기술한 어휘의 역사 정보를 수정하고 보완하여야 할 내용들을 검토하여 정제하였다.
(2007-4) 한민족 언어 정보 검색 통합 프로그램 개발(9)
국어 어문 규정 검색 프로그램, 국어 어휘의 역사 검색 프로그램, 남북한 언어 사전 검색 프로그램, 한국 방언 검색 프로그램을 각 분과에서 정제한 내용을 반영하여 수정하고 통합하는 프로그램을 개발하였다.
4. 맺음말
한민족 언어 정보화 분과에서는 10년 동안 3권의 사업 계획서와 13권의 연구 보고서를 작성하였고, 16개의 프로그램을 개발하여 1개의 프로그램으로 통합하였다. 그리고 이러한 한민족 언어 정보화의 작업 결과는 대부분 21세기 세종 계획의 홈페이지(http://www.sejong.or.kr)에서 검색할 수 있다. 즉 일반 언어 대중들이 컴퓨터를 활용하여 21세기 세종 계획의 홈페이지의 ‘한민족 언어 정보 검색’ 창으로 들어가면 ‘통합 검색, 어문 규정, 남북한 언어 사전, 한국 방언, 국어 어휘의 역사’로 분류한 항목을 찾아볼 수 있다. 여기에서 우리 언어에 관한 여러 가지 정보를 손쉽게 검색할 수 있도록 해 놓았다. 이런 언어 정보화 사업을 통하여 우리의 언어 환경을 조사하고 정리한 내용을 인터넷을 활용하여 손쉽고 빠르게 검색할 수 있는 언어 정보화 기반이 구축되었다는 점은 높이 평가할 수 있을 것이다.
한편 한민족 언어 정보화 사업을 수행하면서 부족했거나 앞으로 보완되어야 할 몇몇 문제점들을 간략하게 소개하면 다음과 같다.
(1) |
사업 주관 기관의 설치, 사업의 기획, 사업 주체의 선정과 관리, 사 업의 진행, 사업의 평가, 사업 평가 결과의 반영 등에 관한 방법을 일관성이 있게, 경제적으로, 합리적으로 그리고 효율적으로 결정해야 한다. |
(2) |
사업 목표의 달성을 위한 적합한 기간, 지속성, 효율성 등의 요소와 사업 수준이 대중 매체의 발전과 국가 환경에 어울리는지의 적절성 등의 조건을 객관적으로 평가하여 합리적으로 조정할 수 있는 방법을 찾아야 한다. |
(3) |
사업의 결과를 전문가뿐만 아니라 관련 산업체와 언어 대중들이 널리 활용할 수 있도록 하는 기구의 설치, 그리고 결과물의 홍보나 판매 등에 관한 적절한 방법을 강구해야 한다. |
(4) |
사업 결과의 수혜자인 언어 대중, 외국인 학습자, 전문직 종사자 등이 사업 과정에 직접적으로나 간접적으로 참여하여 문제점을 제시하거나 해결안을 제안할 수 있는 방법 또는 사업 결과를 보완할 수 있는 방법 등을 찾아야 한다. |
(5) |
사업 주체들의 상호 협조를 통하여 작업의 유기성과 통일성을 이루어 낼 수 있는 방법을 마련해야 한다. |
(6) |
관련을 맺고 있는 여러 전문 분야의 연구 결과와 여러 학문의 발전된 성과를 반영할 수 있는 방법을 찾아야 한다. |
그리고 21세기 세종 계획과 한민족 언어 정보화 사업 등 세부 과제들의 연속성을 고려하여 앞으로 반드시 계속하여 진행해야 할 작업들을 몇 가지 열거해 보면 다음과 같다.
(1) 성, 연령, 직업, 지역 등으로 분류하여 정보, 통신 등의 전문 분야 에서 활용할 수 있는 대규모의 음성 언어 말뭉치를 구축하는 작업
(2) 자료가 출간된 시기별로 대규모의 문자 언어 말뭉치를 구축하는 작업
(3) 연령별로 사용하는 한국어 어휘를 조사하여 정리하는 작업
(4) 전문용어를 조사하고 수집하여 표준화하는 작업
(5) 신어를 조사하여 수집하는 작업
(6) 외래어를 조사하여 수집하는 작업
(7) 현대 한국어 시소러스를 만드는 작업
(8) 모어 화자를 위한 한국어 학습 소프트웨어를 개발하는 작업
(9) 외국인을 위한 한국어 학습 소프트웨어를 개발하는 작업
(10) 한글을 브랜드화하고 세계화하는 작업
(11) 한글 문서를 자동으로 인식하고 처리하는 데에 필요한 프로그램 을 개발하는 작업
(12) 한국의 비표준 한자들을 수집하여 컴퓨터로 입력할 수 있도록 하 는 작업
(13) 한국어를 브랜드화하고 세계화하는 작업
(14) 한국어와 한국 문화 콘텐츠를 융합하는 작업
(15) 사전을 제작하는 데에 필요한 프로그램과 자동 번역과 자동 통역 의 프로그램을 개발하는 작업
(16) 사업의 결과를 사용자가 편리하게 활용할 수 있도록 홈페이지를 제작, 홍보하고 개선하는 작업
끝으로 언어 정보화의 연구 결과를 언어 대중들과 전문직 종사자들이 보다 효율적으로 활용할 수 있게 하고, 또 우리의 말과 글을 세계화하고 명품 브랜드로 만들어 국가 경쟁력을 높이기 위해서는 이미 개발한 프로그램의 지속적인 정제 작업과 또 새로운 보완 작업이 치밀하게 이루어져야 한다는 점을 강조하고 싶다. 그러기 위해서 우리는 우선 언어 정보화라는 과제를 지속적인 사업으로 반드시 설정해야 한다는 점을 분명히 인식해야 한다. 그리고 언어 정보화의 후속 사업을 하루 빨리 치밀하게 계획하여, 적절한 예산을 확보하고, 계획한 사업을 정확하게 실천하여 최대한의 효과를 거둘 수 있도록 관계자 모두가 노력을 아끼지 말 것을 기대해 본다.
참고 문헌
김한샘, 『21세기 세종 계획 백서(1998~2007)』, 서울: 문화관광부·국립국어원. 2007.
박형익, 「국어 어문 규정과 정보화」,
『한국어와 정보화』, 서울: 태학사. 677~719. 2002.
박형익 외, 『21세기 세종 계획 한민족 언어 정보화』, 서울: 문화관광부·국립국어원. 2003.
박형익 외, 『21세기 세종 계획 한민족 언어 정보화』, 서울: 문화관광부·국립국어원. 2004.
이태영 외, 『21세기 세종 계획 한민족 언어 정보화』, 서울: 문화관광부·국립국어원. 2000.
이태영 외, 『21세기 세종 계획 한민족 언어 정보화』, 서울: 문화관광부·국립국어원. 2001.
이태영, 「21세기 세종 계획과 한민족 언어 정보화」,
『한국어와 정보화』, 서울: 태학사. 643~676. 2002.
이태영 외, 『21세기 세종 계획 한민족 언어 정보화』, 서울: 문화관광부·국립국어원. 2002.
이태영 외, 『21세기 세종 계획 한민족 언어 정보화』, 서울: 국립국어원. 2005.
이태영 외, 『21세기 세종 계획 한민족 언어 정보화』, 서울: 국립국어원. 2006.
이태영, 「21세기 세종 계획 한민족 언어 정보화」,
『21세기 세종 계획 최종 성과 발표회 자료집』, 서울: 문화관광부·국립국어원. 187~196. 2007.
이태영 외, 『21세기 세종 계획 한민족 언어 정보화』, 서울: 국립국어원.
2007.
홍윤표 외, 『한민족 언어 정보화(한글 맞춤법 검색 시스템)』, 서울: 문화관광부. 1998.
홍윤표 외, 『한민족 언어 정보화(남북한 언어 비교 사전)』, 서울: 문화관광부. 1998.
홍윤표 외, 『외래어 표기법 검색 시스템』, 서울: 문화관광부. 1999.
홍윤표 외, 『한민족 언어 정보화(표준어 검색 시스템)』, 서울: 문화관광부. 1999.
홍윤표 외, 『한민족 언어 정보화(남북한 언어 비교 사전)』, 서울: 문화관광부. 1999.
홍윤표 외, 『한국어와 정보화』, 서울: 태학사. 2002.
홍윤표, “21세기 세종 계획 성과와 과제”, 「21세기 세종 계획 최종 성과 발표회 자료집」, 서울: 문화관광부·국립국어원. 9~24. 2007.
|