StarDict 사전 파일 데이터 마크업 태그(markup tag)
아이팟 터치에서 가장 널리 활용되고 있는 StarDict 포맷의 사전 파일들의 내용은 XDXF 문서 표준을 일부 차용하여 따르고 있다.
XDXF는 XML Dictionary Exchange Format의 약어로서 XML로 사전 데이터를 저장하는 문서 형식에 대한 표준화 작업이다. 현재 이 표준은 2008년 10월을 기준으로 해서 draft 상태인데, 그 이후로는 표준화 작업이 계속 진행 중이다.
ar 태그 안에서 사용되는 다음의 태그들이 StarDict 사전 파일에서 사용되는데, draft 문서를 참고하여 정리해 본다. 인터넷에서 구할 수 있는 덜 가공되어 있는 사전 데이터를 편집하여 아이팟 터치에서 가장 많이 사용되는 WeDict나 Dictionary Universal 용 StarDict 사전 파일을 직접 만들려는 사람들에게 필요할 것이다. 물론 친숙한 HTML 문법만을 따라 사전 항목의 내용을 작성하는 것도 가능하다.
- <k> 중요 어구(key phrase; 여기서는 단어나 숙어)는 그것을 포함하는 (사전) 항목이 발견될 수 있는 어구이다. 항목은 1개 이상의 중요 어구를 포함할 수도 있다. k 태그는 다른 태그로 감싸지지 않는다.
- <opt> 중요 어구의 선택적인 부분이 있다면 그것을 표시한다. opt 태그는 <k>와 </k> 사이에서만 사용될 수 있다.
- <nu> 중요 어구의 구별을 위해 사용되지는 않지만 모양에만 영향을 끼치는 부분을 표시한다. 중요 어구가 시각적으로 제공될 때, nu 태그의 내용을 포함해야 한다는 것을 의미한다. 하지만 검색과 인덱싱을 위해 nu 태그의 내용은 제거되어야 한다. nu 태그는 <k>와 </k> 사이에서만 사용될 수 있다.
예) 이산화탄소 화학식을 나타날 때, <k>CO<nu><sub></nu>2<nu></sub></nu></k> - <def> 이 태그는 특정 카테고리에 속하는 정의나 정의의 그룹을 표시한다. 영어에 있어서, 이 카테고리는 품사가 될 수 있다. 예를 들어, 명사, 동사, 부사, 등등. def 태그는 감싸질 수 있다. 논리적인 형태를 가지는 항목들에 대해, def 태그를 HTML의 blockquote 태그와 유사한 방식으로 사용할 수 있다. 아니면 각 정의 앞에 ‘1)’,’2)’… 또는 1.’,’2.’… 또는 ‘A.’,’B.’…등등을 놓고 감싸기 레벨에 따라 ‘1)’,’2)’…의 폰트 크기를 늘릴 수 있다. def 태그는 선택적이다. 항목이 간단하고 그룹으로 묶을 게 없다면, 사용하지 마라. 시각적 형태를 가지는 항목들에서 def 태그는 포매팅에 영향을 주지 않는다.
- <pos> 명사, 동사, 부사 등의 품사를 지정한다.
- <tense> 시제. 예) 과거, 현재, 미래, 과거 분사, 등등
- <tr> 발음을 표시한다.
- <dtrn> 이 태그는 중요 어구의 직역을 표시한다.
- <kref> 같은 파일에 있는 다른 중요 어구에 대한 참조.
- <rref> 같은 디렉토리에 있는 리소스 파일에 대한 참조
- <rref start=”xxx” size=”xxx”> 참조가 큰 파일의 특정 부분을 가리킬 때, 오디오와 비디오 파일을 위해 필요한 선택적인 속성이다. start 속성은 관심있는 덩어리의 첫번째 바이트의 파일 위치를 나타내고, size 속성은 그것의 바이트 길이를 나타낸다. start 속성이 빠져 있으면 0으로 가정한다. size 속성이 빠져 있으면 파일 끝까지 플레이된다고 가정한다.
- <iref href=”http://www.somewebsite.com”> 인터넷 리소스에 대한 참조
- <abr> <abbreviations> 절에 나열되어 있는 요약을 표시한다.
- <c c=”xxxxxx”>…</c> c c는 컬러 코드를 나타낸다. 주어진 색으로 텍스트를 표시한다. c 속성의 문법은 HTML과 동일하다. 이 속성이 생략되면 기본 색이 적용된다. 기본 색은 사전 프로그램에서 선택된다.
- <ex> 예제의 텍스트를 표시한다. 보통 프로그램에서 다른 색으로 보여진다.
- <co> 주해를 표시한다. 프로그램에서 보통 다른 색으로 보여진다.
- <su> 부 항목을 표시한다. 부 항목은 중첩된 항목을 표시하는데 사용된다.
이외에 sup, sub, i, b, tt, big, small, blockquote와 같은 XHTML 태그가 사용될 수 있다.
* xdxf 포맷의 데이터를 stardict 사전 파일로 사용하려면 .ifo 파일의 sametypesequence 항목의 값을 x로 지정해야 가능하다.
sametypesequence = x
마찬가지로 html 태그를 사용하려면 x 대신에 h를 사용하면 된다. stardict editor가 기본적으로 m이라는 값을 써넣기 때문에 compile한 후에 반드시 한 번 더 수정해줘야 한다.
댓글 2개
J.Nik
와 정말 완소자료네요. stardict사전파일까보면 txt형식도아닌고 하이터텍스트형식도 아닌게 가끔보였는데 바로 이거였군요!
terzeron
안녕하세요?
제가 빼먹은 사항이 하나 있습니다.
.ifo 파일에 데이터 타입을 지정할 때 h나 m 대신에 x를 사용하시면 xdxf 타입의 데이터를 사용하실 수 있습니다.
jNik님 홈페이지에서 저도 유용한 정보 많이 찾을 수 있었습니다. 감사합니다.