과제구분 | 한국학 기초연구/공동연구과제 | ||
---|---|---|---|
과제코드 | 2006-15 | ||
연구과제명 |
|
||
연구책임자 | 김병선 | ||
공동연구자 |
|
||
연구기간 | 2006-04-24 ~ 2006-11-30 | 연구형태 | |
연구목적 및 배경 | ▨ 한국학중앙연구원에 보존되어 있는 한국구비문학대계 사업의 조사 음성자료를 전자텍스트로 변환하고, 음성자료와 전자텍스트를 동기화하여 데이터베이스에 수록하는 방안을 연구함.
현재 『한국구비문학대계』를 위해 조사된 음성 파일은 모두 20만분 정도이며, 한국역사정보통합시스템에 의해 디지털화되어 있다. 현재 텍스트로 입력된 구비문학 자료도 인터넷을 통해 서비스 되고 있고, 디지털화된 음성 파일도 각각 한국역사정보통합시스템 혹은 한국학전자도서관 사이트를 통해서 단위 파일로 스트리밍 서비스 되고 있다. 두 가지 형식의 자료가 각각 따로 서비스되고 있으므로 두 파일의 연동이 중요한 과제가 된다. 하지만 이건식 박사의 조사에 따르면 그 중 약 6,000분 분량의 음성 파일이 미전사, 미출판 된 것으로 보인다. 따라서 현재로서는 미전사, 미출판 된 6,000분 분량의 음성 파일을 전사하는 것이 시급한 과제가 되고 있다. 적절한 도구만 사용한다면 전사 작업과 더불어 음성 파일과의 동기화를 동시에 처리해 낼 수 있으리라 생각한다. 구비문학 정보 서비스 시스템 구성에 가장 필수적인 부분이라 할 수 있는 음성 파일과 텍스트 파일의 동기화를 통해서 한국학전자도서관 및 역사정보 통합시스템은 고도의 정보 서비스가 가능해질 것이다. 이번 연구에서는 음성 파일과 텍스트 파일을 동기화하는 각종 표준과 도구 및 작업의 절차 등에 관해 연구하기로 하고, 구체적인 연구 대상으로서 미전사 자료 중 약 1,000분 분량의 음성 파일을 전사하려 한다. 본격적인 구비문학 서비스를 위해서는 전체 자료를 텍스트-음성 동기화해야 하는데, 이번 연구가 그 밑바탕을 이룰 것이다. |
||
연구방법 및 내용 | 기존의 구비문학 관련 연구사업의 목록자료와 구비문학 정보 서비스의 목록자료를 대비하여 미전사 녹취자료의 목록을 확보한다. 몇 가지 전사 관련 프로그램을 검토하고, 연구에 사용할 프로그램을 확정한다. 전사 프로그램으로는 LCD의 transcriber 혹은 ‘메아리’를 채택한다. 전사의 원칙과 습유편 발간을 위한 원칙을 마련한다. 메타데이터는 transcriber에서 표현해주는 것을 일차로 받아들인다. 미전사 녹취자료의 음성 파일을 확보하고, 이를 분담하여 텍스트 파일로 전사한다. |
||
연구결과물 세부 목차 | ▶ 연구사업 개괄과 장차의 과제 ▶ 텍스트와 음성 파일의 동기화 및 세그먼테이션 ▶ 구비문학 전산자료의 현황과 미전사 목록의 확정 ▶ 구비문학대계 습유편 집성의 필요성과 미전사분 전사의 원칙 |
||
연구결과 | 한국학중앙연구원의 구비문학 조사사업의 모든 자료가 통합적으로 고도의 정보서비스 될 수 있는 기초를 마련하였다. 음성-텍스트 동기화 서비스로서 문학연구자, 언어연구자, 자연언어연구자 및 관심 있는 일반인에게 귀중한 자료를 제공해 주었다. 음성자료의 정보화에 관련된 각종 기준과 표준화 작업은 향후 유사한 사업에 응용될 수 있다. 앞으로 현장 채록된 구비자료가 적절한 과정을 거쳐 서비스화 되면 우리 문화원형의 자료로서 긴요하게 사용될 수 있다. |
||
참고문헌 |
내용 |
---|