결과보고 요약문

결과보고 요약문: 과제구분, 과제코드, 연구과제명, 연구책임자, 공동연구자, 연구기간, 연구형태, 연구목적 및 배경, 연구방법 및 내용, 연구결과물 세부 목차, 연구결과, 참고문헌, 로 구성
과제구분 한국학 기초연구/공동연구과제
과제코드 1997-어문-1
연구과제명
  • 국문 : 한국 현대시 시어사전의 편찬(IV)
  • 영문 : -
연구책임자 김병선
공동연구자
  • 조창환 / 아주대학교 / 교수
  • 김영민 / 연세대학교 / 교수
  • 전정구 / 전북대학교 / 교수
연구기간 1997-01-01 ~ 1997-12-15 연구형태 공동
연구목적 및 배경

연구목적
   이 연구는 한국 현대 시문학작품에 대한 원전 비평을 통하여 확정된 교정본을 대상으로, 전산 입력 및 자료 처리의 방법으로 가공하여 시어 및 용례목록을 만들고, 최종적으로는 시어에 대한 해설을 붙이고 그 용례를 제시하며, 각종 참고 색인을 덧붙인 한국현대시어사전의 편찬을 목적으로 한다. 금년도는 이 사업의 제4차년도로서, 1,2,3차 연도의 연구 결과물 종합하고, 최종 교정을 시행하며, 출판에 대비하여 시어의 의미에 대한 확정 작업과 시어 해석 및 주석 작업을 실행한다. 이를 위해 부수적으로 불용어 목록을 만들어, 올림말의 범위를 확정하며, 바람직한 사전 형태에 대한 연구도 시행한다. 아울러 시어 올림말에 대한 전산 가공을 통하여 각종 색인을 제작하고, 계량적 분석의 자료를 만든다.
   연구의 결과는 추후 사전 형태로 출판하여, 문학인, 인문과학 연구자 및 일반인에게 보급하도록 한다.

 

연구배경
   근래에 들어서 어문 자료에 대한 전산처리가 보편화됨에 따라, 우리나라에서 출판된 거의 모든 텍스트가 전산 입력되고 있는 실정이다. 그 입력의 목적은 여러 가지가 있을 수 있으나, 대체로 말뭉치(lingustic corpus)를 만들어서 사전을 제작하며, 단어의 빈도수 등을 조사하여 언어 교육과 언어 정책의 기본 자료로 활용하려는 것이다. 국립국어연구원의 통일대사전(가칭)이나 연세대학교 사전편찬실, 고려대학교 언어정보연구소 등에서 만들고 있는 것들이 바로 그 예가 될 수 있다.
   우리 한국정신문화연구원에서도 그동안 수년간에 걸쳐서 우리 옛문헌을 전산입력하여 이를 세기별 국어사전 형태로 출판하고 있는 중이며 그 첫 예가 17세기 국어사전이다. 범용 말뭉치는 그 외에도 한국어전자사전의 바탕을 이루며, 구문해석기 등 자연언어 처리 분야에서 필수 자료로 사용되고 있다.
   말뭉치의 종류에는 여러 가지가 있을 수 있으나, 위와 같은 범용 말뭉치 외에 특수 분야의 말뭉치가 만들어질 수 있다. 특히 문학작품 말뭉치는 여러 가지 면에서 의미를 가지고 있다. 최근에 고려대학교 민족문화연구소에서 제작한 한국현대시 CD-ROM도 그 한 예가 된다. CD-ROM은 현대시 16,000여편을 수록한 큰 업적을 남겼지만, 문학 작품에 대한 본격적인 연구의 자료로서 활용되기는 힘들다. 왜냐하면 현대시 이 CD-ROM이 원전 비평을 소홀히 했으며, 심지어는 현대어로 개편한 것도 있기 때문이다. 그 이유는 이 CD-ROM이 현행 KSC 5601 완성형 코드 체계로 운영되기 때문이다. 또한 이 CD-ROM은 단지 시에 대한 검색, 시어에 대한 검색, 참고 자료 확인 등의 기능만 가지고 있을 뿐, 본격적인 용례 사전 형태를 가지지는 못하였다.
   시어 사전은 현대시에서 어떠한 시어들이, 어떠한 문맥에서 사용되었는지를 보이는 용례사전의 일종이다. 따라서 이 사전은 은유나 상징과 같은, 언어의 특별한 용법을 각 시인이 어떻게 사용했는지 비교하여 살필 수 있는 자료를 제공해 줄 것이다. 한편 이 사전은 일정 시기에 사용된 특별한 언어의 집성이기도 하여, 다른 시기의 시어들과의 비교 연구에도 크게 도움이 될 수 있다.
   이러한 사전이 만들어짐으로써 일반인들에게는 시작품 이해력을 높여 주는 일에 도움이 되며, 언어를 순화하는 일에도 도움이 될 것이다. 문학 연구자들에게는 연구의 새로운 안목을 제시해 줄 뿐 아니라, 구체적인 연구 재료를 제공할 수도 있다. 시인이나 시를 공부하는 사람들에게는 아름답고 적절한 시어를 사용할 수 있게 하는 안내자의 역할을 할 수 있다.

연구방법 및 내용

연구방법
   (1) 본 연구는 일차적으로는 문헌 연구의 형태를 지닌다.
      앞 연구 배경 및 자료 항목에서 밝힌 바 있듯이, 연구의 대상은 현대 시인의 시작품이다.
      각 연구자별로 자료 입력 및 주석 작업 대상 작품을 선정하고 전산입력한다.
      일단 기초 자료는 태학사판 한국현대시사자료집성과 한양대판 한국현대시자료대계로 한다.
      각 연구자별로 선정된 시인의 작품을 대상으로 원전 비평을 통해서 결정본을 확정한다.
      마지막으로 결정본을 대상으로, 단어를 추출(lemmatisation)하고, 의미 범주를 분석하며, 주석을 붙인다.
   (2) 2단계는 이를 컴퓨터 데이터화하여 처리하는 것이다.
      선정된 시 작품은 컴퓨터에 일정한 구조로써 입력, 저장된다. 전산 입력은 현재 가장 편의로운 ᄒᆞᆫ글3.0판을 이용한다. 입력시 글자(문자코드)의 부재로 인하여 처리되지 못한 글자들에 대한 원칙을 정하고 폰트를 개발하여 입력한다.

 

연구내용
   한국 현대시 시어 사전은 그 대상이 되는 시작품이 방대한 만큼, 전체적으로는 4년간에 걸쳐 연차 계획으로 편찬되고 있으며, 연구 책임자의 1993년도 과제인 현대시 데이터베이스구축에 관한 연구에 기초하고 있다. 본 사업은 제4차 연도로서 사업을 마무리하는 차원에서 이루어진다.


   이 연구는 지난 3년간에 걸쳐 다음과 같은 작업이 이루어져 왔다.
   1. 현대시 시어 사전 편찬의 기획(1차년도)
   2. 현대시 시어 사전 자료 선정, 자료 확정, 자료 입력 작업(1,2,3차년도)
   3. 현대시 전산 데이터베이스 구축에 대한 연구(1차년도)
   4. 현대시 입력 원칙 제정(1차년도)
   5. 시집 수록분 시 작품에 대한 교정(1,2,3차년도)
   6. 시집 이외의 시 작품을 대상으로 자료 확정, 자료 입력 및 주석 작업(3차년도)


   이번 4차년도는 다음 내용으로 이루어지며, 연구 분담 내역은 다음과 같다.
   1. 3차년도의 사업에 대한 검토, 보완 및 4차년도 사업 기획
   2. 주요 시어 선정 작업, 주석 작업, 의미해설 작업
   3. 연구 결과의 종합, 사전 형태 연구
   4. 시어 사전 원고 완성
   〈 연구자별 역할 분담 내역
      ◦
 김병선 : 연구사업 총괄, 1,2,3차년도 사업에 대한 전반적인 검토 보완 및 4차년도 사업 기획, 색인 및 계량적 연구를 위한 자료 프로그램 제작
      ◦ 조창환 : 적절한 사전 형태에 대한 연구 및 편집, 중요 시어 의미 해설 집필
      ◦ 김영민 : 시어 색인 목록 작성 및 시어 의미 해설 집필
      ◦ 전정구 : 최종 교정, 시어 의미 해설 집필

연구결과물 세부 목차

자료의 선정과 확정
   : 공동연구자들이 협의하여 편찬 대상 자료를 선정하였고, 분담하여 자료 확정을 하였음.
자료의 입력과 교정
   : 공동연구자들이 편찬 대상 자료를 분담하여 입력 · 교정하였음.
자료의 가공과 처리
   : 기본적인 처리는 공동연구자들이 하였고, kwoc 색인의 가공 및 출력형태 처리는 연구책임자가 하였음.

연구결과

   이 연구의 결과 1908년부터 1950년까지의 현대시집 총 172권을 전산입력하여 사전 편찬을 위한 전산처리를 시행하였다. 이로써 올림말 시어가 확정되었고, 바람직한 현대시어 사전 형태에 대한 연구를 수행하였으며, 시어사전의 전산 원고를 작성하였다.

 

1. 연구사업 진행 경과 보고
   이 연구사업은 1994년부터 1997년까지 4년간에 걸쳐서 추진되는 공동 연구사업이다.
   사업의 목표는 한국현대시의 시어사전을 편찬하는 것이다.
   사업의 범위는 1910년부터 1950년까지의 현대시집에 수록된 시작품을 대상으로 한다.
   시인수는 110, 시집수는 172(?), 작품수는 8,000여편이다.
   입력 자료는 한국현대시사자료집성(태학사) 및 한국현대시사자료대계(한양대학교)를 저본으로 하였고, 일부 시인의 경우에는 전집을 저본으로 하였다.
   사업의 방법은 상기 시작품을 전산입력하고, 이를 전산처리하는 것이다.
   그 결과로 시어용례색인이 만들어지는데 이를 사전으로 출판하는 것이다.
   1997년도는 이 사업이 종료되는 해로서 사전편찬을 위한 원고를 완성한다.


   사업 진행과정은 다음과 같다.
      (1) 입력 작품 확정 및 목록 작성
      (2) 입력본에 대한 양식 통일 및 교정 처리
      (3) 교정용 색인 제작
      (4) 원문대조 교정
      (5) 색인 제작
      (6) 형태소 분석을 통한 올림말 추출
      (7) 올림말 풀이
      (8) 사전 형태 편집
      (9) 출판

 

2. 사전 형태에 대한 연구 보고
   (1) 사전의 형태는 다음과 같이 정한다.
      올림말(가나다순) - 활용형(가나다순) - 예문 - 출전(출전순)
      한국정신문화연구원에서 출판한 17세기 국어사전의 형태를 지향한다.
   (2) 예문 출력
      - 범위 : 문장 단위(시의 경우 애매함), 연 단위(길이의 편차가 심함), 행 단위(정보가 부족함) 중에서 연의 범위를 넘지 않도록 조정한다.
      - 좌우 길이 : 문맥을 밝힐 수 있는 충분한 길이로 한다.
      - 처리 단위 : 다음중 음절 단위로 하되 연의 범위를 지킨다.
      - 어절 단위 : hwp 기능 활용(김소월) *참조표 제시
      - 음절 단위 : hgrep 활용 **추천
      - 문장 단위 : program 처리(이건식), 17c 국어사전
   (3) 출전 표기
      - 완전 표기 : 시인명, 시집명, 작품명, 작품상의 위치
      - 간략 표기 : 000:작품명
                             : 3단위의 숫자로 시집명 표시
                             : 8자 이내의 작
품명 표기

 

3. 올림말 선정과 불용어처리
   올림말로는 일부 stop word를 제외하고 모든 어휘 항목을 선정한다.
   올림말에는 특별한 문법 형태소를 추가한다.
   제외되는 불용어로는 연번호, 문장부호 등이 있다.
   완전 풀이와 중요어구 풀이의 방법이 있는데, 중요어구만 풀이한다.
   사전적 의미와 문맥적 의미 중 사전적 의미만 밝힌다.

 

4. 텍스트의 입력에 따른 문제와 그 대책
   (1) 자료 교정
      문제점 : 판본 확인 완전하지 않음. (1, 2판 혼잡)
                     : 
교정본 처리를 해야 하는지 (색인 작업이 참고가 됨)
                     : 공동시집의 처리 방법
   (2) 전처리

      띄어쓰기 : 어절 단위로 처리함.
            언어학적 원칙적 구분 vs 문학적 의미적 이용 가능성
   (3) 자료의 구조 및 입력 원칙
      시집 1권을 1개의 ᄒᆞᆫ글파일로 저장하였음.
      각 시집에는 헤더(시집명, 출판사, 출판일 등)를 붙이고, 시작품마다 제목을 붙였음.
      원문의 표기와 형태를 충실히 반영하되, 오기가 분명한 것은 임의로 수정하였음.
      띄어쓰기는 어절색인을 전제로 하여 현대식으로 수정하였음.
      불명확한 글자는 (?)로 표기하였음.

참고문헌

전정구 편, 소월 김정식 전집 1,2,3, 한국문화사, 1993.
김병선, 전정구, 소월의 시어와 그 쓰임새 1,2,3, 한국문화사, 1993.
김영민, 교열본 수주 변영로 시전집, 한국문화사, 1989.
김흥규, 송강 시의 언어, 고려대학교출판부, 1993.
김병선, 국어와 컴퓨터, 도서출판 한실, 1992.
Butler, Christopher, Computers in Linguistics, Basil Blackwell Ltd. 1985.
고려대학교 민족문화연구소, 한국의 현대시(CD-ROM), 대한교과서주식회사, 1996.

기타

기타: 내용으로 구성
내용
TOP
전체메뉴