728x90
5. DTD & XML

오늘은 지난번에 하겠다고 했던 DTD 예제를 가지고 XML문서로 만들어 가는 걸 설명해 드리려고 합니다.



오늘 예제는 제가 MS 사이트에서 가져온 것으로 일반적인 음악 CD에 대한 항목을 나타내는 예제입니다. 해당 소스는 자 에서 받으실 수 있습니다.



먼저 이 문서의 DTD를 살펴보도록 하죠.

1: <!ELEMENT compactdiscs (compactdisc*)>
2:     <!ELEMENT compactdisc (artist, title, tracks, price)>
3:           <!ENTITY % Type "individual | band">
4:           <!ELEMENT artist (#PCDATA)>
5:                  <!ATTLIST artist type (%Type;) #REQUIRED>
6:           <!ELEMENT title (#PCDATA)>
7:                  <!ATTLIST title numberoftracks CDATA #REQUIRED>
8:           <!ELEMENT tracks (track*)>
9:           <!ELEMENT price (#PCDATA)>
10:         <!ELEMENT track (#PCDATA)>





위의 DTD는 다행히도 제가 지난 강좌에서 설명한 엘리먼트와 속성으로 이루어져 있습니다.

실제로 여러 DTD를 보면 무지무지 복잡하게 되어 있습니다. 그러나 기본적으로 꼭 알아야 하는 것이

바로 엘리먼트와 속성입니다. 이 두가지만 잘 파악하고 있으면 어떤 DTD에도 빠르게 적응할 수 있을 겁니다.

번호는 설명을 위해서 제가 붙여놓은 것입니다. 실제 DTD에는 번호가 붙지 않습니다.



여러분이 소스를 테스트 하시려면 반드시 "1:" 이 부분을 모두 삭제하고 사용하시기 바랍니다.



DTD를 한번 쭉 살펴 볼까요?

어라!! 잉~~ 모르는 것이 중간에 하나 끼어 있네요..



3번줄을 보세요... ENTITY라?? 분명 XML 구성요소를 할 때는 설명이 나왔는데 DTD에는 설명이 없었죠.

자~ XML 구성요소에서 설명한 것으로 생각을 해보세요. ENTITY는 텍스트나 Binary 데이터, 비 ASCII 문자열을 대치한다고 했죠.

생각 나세요.. 쿠쿠 제 강좌를 참 잘 따라온 분이네여~~ 생각이 안나시는 분은 앞부분을 참고하세요.



엔터티는 XML 문서에서 사용될 수도 있지만 DTD문서에서도 사용될 수 있습니다.

DTD 문서에서 사용되는 엔터티를 파라미터 엔터티라고 하죠.

우리가 XML에서 엔터티를 사용할 때 < & & 이런 형태로 사용했죠..

DTD에서는 %lt; % %amp;라고 사용을 합니다. 좀 다르죠.. 의미는 거의 비슷하다고 보면 됩니다.



자 그럼.. 위에서 <!ENTITY % Type "individual | band">



은 Type이란 엔터티를 "individual | band"로 바꿔라 라는 의미로 해석하면 됩니다.



그럼 Type이 사용된 곳을 보죠.. 5번째 줄에 보면 %Type; 이란 부분이 있죠. 그부분을 바꿔 주면 됩니다.

즉, 위와 같은 경우 다음 두줄을 이렇게 한줄로 바꿀 수 있습니다. 의미는 같네요. <!ENTITY % Type "individual | band">

<!ATTLIST artist type (%Type;) #REQUIRED>



  <!ATTLIST artist type (individual | band) #REQUIRED>



실제로 소스를 다운 받아서 바꿔서 사용해 보세요. 당연히 됩니다.

참고 : 지난번처럼 하면 안됩니다. 송선희님이 지적해 주셨네요.. 감사합니다. 새롭게 고쳐 놓았습니다.

          %Type; => individul|band 로 바꾸는 거네요. 그래서 위처럼 하셔야 합니다.

          실제로도 XML 스펙에 보면 위와 같은 속성 타입을 열거형이라고 하는데요.

          열거형은 ()로 둘러쌓여 있구요.. |로 구분한다 라고 나와있네요. 죄송함다.. 제가 미리 체크하지 못했네요 T__T



그럼 여기서 당근 질문을 하나 하셔야 합니다. 왜 파라미터 엔터티를 사용하느냐?



그냥 직접 쓰면 되는데?? 그건 우리가 C나 C++에서의 #define을 사용하는 이유와 같습니다.

위에서 Type에 하나가 추가되었다고 보죠. 즉, 지금은 개인과 밴드만이 존재하는데.. 만약 듀엣이 추가된다면??

DTD 전체를 바꿔야겠죠..



그게 복잡한 DTD라면 더욱 머리가 아파지는 거지요.. 하지만 엔터티를 사용했다면 엔터티 선언 부분만 바꾸면 됩니다.

당연히 엔터티의 효용도가 높아 지겠죠. 실제로 많은 DTD가 이 엔터티를 주로 사용합니다.



자, 그럼 계속 가 볼까요?? 우리가 할 일은 위의 DTD를 보구서 XML 문서 하나를 만들어 가는 겁니다.

1번줄을 보세요. <compactdiscs>는 <compactdisc>를 여러번 포함할 수 있습니다. <!ELEMENT compactdiscs (compactdisc*)>



제가 어떻게 여러번 포함될 수 있다는 것을 알았을까요? 그것은 * 때문입니다. 이런 기호들의 의미가 지난 강좌에 소개 됬었죠.



그렇다면 다음처럼 만들어 줄 수 있을 겁니다.

<compactdiscs>

    <compactdisc>

    ...

    </compactdisc>

    <compactdisc>

    ...

    </compactdisc>

</compactdiscs>





그리고 나서 2번의 <compactdisc>를 살펴보죠.. <!ELEMENT compactdisc (artist, title, tracks, price)>



(artist, title, tracks, price)  이렇게 나와 있습니다. 맨 뒤에 아무것도 없으니까 1번 나타난다는 의미고요.

, 로 되어 있으니까 순서대로입니다. 지난번 강좌와 연결해서 이해가 되나요??



그러므로 <compactdisc>는 <artist>, <title>, <tracks>, <price>가 순서대로 나타난다고 보시면 됩니다.

<compactdisc>

    <artist></artist>

    <title></title>

    <tracks></tracks>

    <price></price>

</compactdisc>





자 여기까지 별 어려움이 없죠.. 계속 가보죠..

4번째 줄을 보면 <artist>는 #PCDATA를 가지고 있습니다. <!ELEMENT artist (#PCDATA)>



#PCDATA가 뭐였죠? 파싱된 문자데이터.. 그냥 문자열로 생각하면 편하다고 했죠.

즉, <artist>는 문자열을 자식으로 가지고 있고요.



이어서 5번째 줄을 보세요. <artist>는 속성을 포함하고 있다고 나와 있죠.. <!ATTLIST artist type (%Type;) #REQUIRED>





속성의 이름은 type이고 파라미터 엔터티를 문자열로 바꾸면 "individual | band" 이므로 열거형으로 둘중의 하나를 값으로 가져야 하고요.

그리고 반드시 필요한 속성이라는 것이죠.. 4,5번을 종합해 보면 다음과 같이 작성해야 한다는 거네요..

<artist type="individual">Frank Sinatra</artist>





6번째와 7번째 줄의 <title>도 비슷합니다. <!ELEMENT title (#PCDATA)>
    <!ATTLIST title numberoftracks CDATA #REQUIRED>





자식으로 CD제목을 나타내는 문자열(#PCDATA)를 가지고 있구요. 속성은 문자열 속성을 가진 numberoftracks가 있습니다.

다음과 같은 형태로 작성하면 되죠..

<title numberoftracks="4">In The Wee Small Hours</title>





여기서 잠시 생각할 것이 numberoftracks의 값은 분명 숫자일 것입니다. 그러나 제가 지난번에 설명했듯이 DTD에서 숫자형이란

데이터 타입은 없습니다. 그냥 모두 문자열일 뿐입니다.



8번째 줄과 10번재 줄을 보면 <tracks>는 여러개의 <track>을 포함할 수 있고 <track>은 내용으로 문자열을 넣어주면 됩니다.

<!ELEMENT tracks (track*)>
    <!ELEMENT track (#PCDATA)>





적용해 볼까요? 이런 형태로 사용할 수 있습니다.

<tracks>

    <track>In The Wee Small Hours</track>

    <track>Mood Indigo</track>

    <track>Glad To Be Unhappy</track>

    <track>I Get Along Without You Very Well</track>

</tracks>





마지막으로 9번째 줄을 보면 <price>는 가격 정보를 나타내는 문자열로서 다음처럼 작성하면 됩니다.

<price>$12.99</price>





여기에 XML 문서 선언 부분을 넣구요. DTD를 선언하는 부분도 넣어서 다음처럼 완성할 수 있습니다.

  <?xml version="1.0"?>
<!DOCTYPE compactdiscs SYSTEM "cds.dtd">
<compactdiscs>
  <compactdisc>
    <artist type="individual">Frank Sinatra</artist>
    <title numberoftracks="4">In The Wee Small Hours</title>
    <tracks>
          <track>In The Wee Small Hours</track>
          <track>Mood Indigo</track>      
          <track>Glad To Be Unhappy</track>
          <track>I Get Along Without You Very Well</track>
    </tracks>
    <price>$12.99</price>
  </compactdisc>
  <compactdisc>
    <artist type="band">The Offspring</artist>
    <title numberoftracks="5">Americana</title>
    <tracks>
           <track>Welcome</track>
           <track>Have You Ever</track>  
           <track>Staring At The Sun</track>
           <track>Pretty Fly (For A White Guy)</track>
    </tracks>
    <price>$12.99</price>
  </compactdisc>
</compactdiscs>





DTD가 주어졌을 때 XML 문서를 생성하는 방법을 간단하게 알아보았습니다. 이것을 통해서 DTD를 좀더 편하게 보았으면 해서

제가 강좌로 마련해 보았네요.



실제로 여러분에게 DTD가 주어졌을 때 이런 형식으로 적용할 수 있다면 앞으로 다가올 웹의 변화에 빠르게 적응할 수 있을 겁니다.

왜냐면 지금 시작되고 있는 웹의 변화는 XML을 기반으로 한 DTD에 있다고 볼 수 있으니까요? 넘 거창했나요?? ^^;;

어쨌거나 반대로 만약 XML 문서를 새로이 받았을 때 이 DTD를 공유하고 있다면 의미해석을 더욱 쉽게 할 수 있을 겁니다. 2002/08/02  From 미니

출처 : 미니의 XML DeveloperGroup (http://www.word.pe.kr)

'프로그램언어 > XML' 카테고리의 다른 글

6. XSL & XML  (0) 2008.06.02
4. DTD란?  (0) 2008.05.14
3. XML의 구성요소  (0) 2008.05.14
2. XML의 시작  (0) 2008.05.14
1.1 XML 이란?  (0) 2008.05.14
728x90
4. DTD란?

  요새 냉방병에 눈병이 심하다고 하네요.. 저도 어째 눈이 좀 안좋아서 안과에 다녀왔네요.. 모두들 뜨거운 여름에 몸 조심하세요.. 그리고 제가 여기에 올리는 강좌는 초보자를 위한 글입니다. 첨 홈페이지를 제작할 때는 XML에 관심이 많아서 많은 분들이 찾아왔었지만, 지금은 XML의 기본사항은 마치 HTML처럼 널리 알려진 내용이 되었네요.. 그래도 또 다시 새롭게 시작하는 분들을 위해서 이 글을 정리해 놓습니다. *^^*



자 그럼 시작해 볼까요?



DTD는 XML 문서에 사용될 구성요소를 정의해 놓은 것으로 생각하면 됩니다. Document Type Definition

그런데 생각보다 DTD는 좀 어렵습니다. 만약 DTD를 설계해야 한다.. 그러면 더욱이 어려워지죠.

제 생각에 초기 DB를 설계하기 위해서 DBA가 필요했던 것처럼 XML에서 DTD를 설계하는 사람도 필요해지겠죠..



그러나 차이는 조금 있습니다. DB를 사용하려면 누구나 DB의 스키마를 정의해야 하지만..

XML을 사용하기 위해서는 DTD를 정의하기 보다는 기존에 정의된 DTD를 가져다가 사용하는 경우가 많이 발생하겠죠.

당연하죠.. 왜냐면 만약 누구나 자기 DTD만 정의해서 사용한다면 그 DTD가 가치를 지닐수 있을까요???

실제로 보면 DTD는 W3C나 기타 XML 관련 기관에서 발표되고 있고 표준화되고 있습니다.



그렇다면 우리의 공부 방향은 어디냐?? 물론 지금 이글을 보시는 분중에서는 DTD를 설계할 필요가 있으신 분도 있겠죠.

그러나 대부분은 DTD를 이해만 하면 될 겁니다. 그래서 오늘은 DTD와 XML에서 가장많이 사용되는

엘리먼트와 속성의 선언에 대해서만 알아보도록 하겠습니다.



DTD의 필요성



HTML에서 <font>라는 태그를 사용했을 때 우리는 <font>가 글자의 글꼴, 색깔, 크기등과 관련이 있다는 것을 잘 알고 있습니다.

우리가 이걸 어떻게 이해하느냐? 그것은 HTML DTD에 <font>태그는 이러이러한 것이고 속성으로는 뭘 가질수 있고..

등등의 정보가 표현되어 있기 때문입니다.



앞에서 설명했듯이 한 공동체에서 이러한 태그를 공유해 특정 부분을 정보화 할 경우 해당 정보의 가치는 더욱 높아질 것입니다.

왜냐하면 그러한 문서는 사람뿐만 아니라 컴퓨터도 쉽게 해석할 수 있고 공동체 내에서 자유롭게 변환이나 이동이 가능하기 때문입니다.

그렇다면 이러한 태그정보를 어떻게 공유할 수 있는가? 계속되는 같은 질문이죠. ^^:;

바로 DTD를 이용해서입니다. DTD의 개념은 XML 이전인 SGML에서부터 존재했습니다.

SGML에서 사용되던 DTD를 간략화 해서 XML에서 사용하게 되었지요. 그래서인지 DTD는 몇가지 문제점을 가지게 되었습니다.



첫째로 DTD에서 정의된 엘리먼트나 속성의 값이 가지게 될 타입을 정의할 수 없습니다.

즉, 정수형, 문자형, 날짜형.. 등등의 변수의 타입을 지정할 수 없는 것입니다. 그래서 DTD가 수행하는 중요한 기능중의 하나인

Validation Check(유효성검사)에서 보다 더 정밀하게 검사할 수 없게 되는 거지요.



둘째로는 DTD문서가 XML문서의 형태가 아니므로 XML 에디터 이외에 또다른 DTD 에디터를 필요로 한다는 것입니다.

이것은 XML과 DTD를 따로 배워야 한다는 문제도 발생시키죠.



그래서... 새롭게 XML 형식의 DTD를 정의하면서 타입도 지정할 수 있는 것이 등장했습니다.

그게 바로 XML Schema입니다. 참 공부하기 어렵죠.. 하나 해두면 또 하나 나오고.. 윽~~~

관심있으신 분은 W3C의 홈페이지에 가서 확인해 보시길 바랍니다. 여기서는 그냥 DTD 이야기만 하죠.



여러분이 알고 있는 HTML, WML, SMIL등등이 각각 자신의 DTD를 가지고 있는 XML 문서라고 보면 됩니다.



그럼 DTD의 구성요소를 하나씩 살펴보도록 할까요? 그러기 위해서 지난번 예제를 다시 사용하도록 하죠. <?xml version="1.0"?>

<html>

   <head>

      XML Developer

   </head>

   <body>

     <img src="xml.gif"/>

     <a href="http://xmlis.pe.kr">Hello World</a>

   </body>

</html>





엘리먼트의 선언



DTD에서 엘리먼트를 선언하는 형식은 다음과 같습니다. <!ELEMENT 이름 내용>



이름은 사용될 엘리먼트의 이름을 나타내고요. 내용은 자식으로 나타날 수 있는 것들을 적어주면 됩니다.



자 그럼 위의 예에서 <body>태그를 DTD에서 정의한다고 해보죠..

이름은 당연히 body가 되겠죠. 그리고 내용은 <body>와 <body>사이에 나타나는 것을 적어주면 됩니다.

그것이 바로 자식으로 나오는 것이죠.. 위에서 보면 <img>태그와 <a>태그가 나타나고 있죠.



그런데.. <img>나 <a>태그는 순서가 바뀌어도 되고, 또 여러번 나올수도 있다고 합시다.

<body><img...><img...><a...><img...></body>

뭐 이런형태로 나올수 있다고 가정해보죠.. 그런 경우 DTD 선언은 다음과 같이 할 수 있습니다.



이름 : body

내용 : img 또는 a가 여러번 발생 <!ELEMENT body (img|a)*>





위와 같은 형태로 작성이 가능합니다. 휴~~ 어렵죠.. 좀만 더 참고 보세요..

여기에서 어렵게 느끼는 이유는 못보던 것이 나와서입니다. |나 *같은 기호죠.. 다음 표를 참고하세요.

|

 엘리먼트 내용이 선택적으로 나타날 수 있다.

,

 엘리먼트 내용이 순서대로 나타나야 한다.

?

 엘리먼트 내용의 출현회수가 생략되거나 한번 나타난다.

*

 엘리먼트 내용의 출현회수가 생략되거나 여러번 나타난다.

+

 엘리먼트 내용의 출현회수가 최소 한번 이상 나타난다.


 엘리먼트 내용의 출현회수가 한번만 나타난다.



무슨 이야긴지 아시겠어요?? 혹 추가적인 설명이 필요하면 Q&A를 이용하시거나 저한테 멜 주세여..



자 이해하기 쉽도록 몇 개 더 해보죠.

<head>와 같은 걸 선언을 한다고 해보죠.. 이름은 head 내용은 어라?? 그냥 문자열이죠.

XML에서는 이러한 것을 #PCDATA라고 부릅니다. 파싱된 문자 데이터라나요?? 단순한 문자열로 인식하면 됩니다.

다만 그 문자열이 XML 문서을 읽을 때 파싱된다는 의미를 가지고 있습니다.



이름 : head

내용 : #PCDATA 가 한번만 출현한다. <!ELEMENT head (#PCDATA)>





뒤에 아무런 기호도 안 붙었죠. 위의 표에서 맨 마지막 것입니다.

그런데.. XML에서 <img>와 같은 태그는 내용을 포함하지 않는 엘리먼트라고 지난번에 설명했죠..

그걸 뭐라고 했죠??? 빈 엘리먼트(Empty Element)라 그랬죠.



문제는 그겁니다. 내용이 없는데 <img>는 어떻게 정의할 수 있을까?? <!ELEMENT 이름 EMPTY>



이렇게 하면 되겠죠.?? 적용시켜 보면

  <!ELEMENT img EMPTY>





휴~~ 엘리먼트에 대해서 이정도로 해두죠.. 어렵나요? 아마 첨 보는 분은 어려울 겁니다.

우리가 무엇이든 시작하려 할 때 가장 어려운 것은 용어라고 생각합니다. 머리에 들어오지 않는 용어가 문제죠.

그런 경우라면 자주 보세요.. 그 방법밖에는 달리 추천할 방법이 없네요.. T__T



속성의 선언



DTD에서 속성을 선언하는 형식은 다음과 같습니다. <!ATTLIST 엘리먼트이름 속성이름 속성형 (속성기본값)>





엘리먼트이름은 속성을 포함할 엘리먼트의 이름을 나타내고요. 속성이름은 속성의 = 왼쪽에 나타나는 이름이고요.

속성형은 속성이 가질수 있는 타입이고, 속성기본값은 속성의 필요여부등을 나타냅니다.



속성형과 속성기본값은 아래와 같이 정리할 수 있습니다.

속성형

선언형태

설명

문자열 속성

 CDATA

 일반적인 문자열

토큰 속성

 ID

 엘리먼트의 ID

 IDREF

 엘리먼트의 ID를 가리키는 포인터

 IDREFS

 하나이상의 IDREF들

 ENTITY

 외부 엔터티를 가리키는 포인터

 ENTITIES

 하나 이상의 엔터티 값들

 NMTOKEN

 토큰 문자열

 NMTOKENS

 하나 이상의 토큰 문자열들

열거 속성

 (값1 | 값2 | 값3 | ...)

 선택 가능한 값을 목록으로 나타냄



속성의 기본값

설명

 #REQUIRED

 속성값이 반드시 필요한 속성이다.

 #IMPLIED

 속성값이 지정되지 않은 경우 XML 프로세서가 암시적으로 할당한다.

 #FIXED

 속성값이 DTD에 지정된 값과 반드시 같아야 한다.





여기까정입니다. 휴!~ 내가 읽어봐도 몬 소린지 하는지.. 쩝.



예를 하나만 들어보죠. 위에서 <img>태그가 있었습니다. <img>태그의 src 속성을 선언한다고 해보죠..



엘리먼트이름 : img

속성이름 : src

속성형 : 문자열 속성 (CDATA)

속성기본값 : 필요함

  <!ATTLIST img src CDATA #REQUIRED>



이런형태로 사용됩니다.

속성과 관련된 선언도 이정도로만 하겠습니다.



DTD에는 더 많은 구성요소가 있습니다. 하지만 일단 현 강좌가 기초이고 저의 실력도 삐리리 한 만큼 여기까지만 하겠습니다.

대신에 다음 강좌에서는 MS사이트에 예제로 나와있는 음반과 관련된 아주 간단한 DTD가 있습니다.

오늘 배운 엘리먼트와 속성만 나와 있죠. 그걸 가지고서 XML 문서를 만들어 가는 예제를 해보려구 합니다.



그것이 DTD와 관련된 구성요소를 계속 설명하는 것보다는 훨씬 나을 것 같아서요..

그럼..  2000/08/02  From 미니

출처 : 미니의 XML DeveloperGroup (http://www.word.pe.kr)

'프로그램언어 > XML' 카테고리의 다른 글

6. XSL & XML  (0) 2008.06.02
5. DTD & XML  (0) 2008.05.28
3. XML의 구성요소  (0) 2008.05.14
2. XML의 시작  (0) 2008.05.14
1.1 XML 이란?  (0) 2008.05.14
728x90
2. XML의 시작

  무더운 8월입니다. ^^ 이 글을 첨 썼던 때가 2000년 12월이니까.. 와우.. 많은 시간이 흘렀네요.. 그때도 시간이 참 빠르다는 표현을 했던것 같은데~~

어느 사이트를 돌아다니다 보면 제 강좌를 복사해서 사용하는데도 있더라구요. 그래도 별 상관은 없지만.. 출처는 밝혀주심이 좋겠네요. 지난번만큼의 강좌를 다 수정해서 올리는데 약간의 시간이 걸릴거고요. 그리고 나서는 새로운 강좌를 시작할 겁니다.



자 그럼 오늘 강좌를 시작해 볼까요.. 소스는 강좌소스 에 보면 있습니다. 거기로 가서 받아가시기 바랍니다.



간단한 XML 예제

  XML 문서는 DTD의 포함 여부에 따라서 Well-formed 문서와 Valid문서로 나눌 수 있습니다.

먼저 새로운 단어를 분석해 볼까요?? Well-formed란 잘 구성되었다고 해석을 많이 하더군요.

잘 구성되었다?? XML 스펙을 보면 XML 문서가 갖추어야 할 조건들을 설명하고 있습니다.

그 조건을 잘 지키고 있다면 Well-formed라고 하는 것이지요.



참고로 첨 XML 스펙을 보았을 때 머리가 돌아 버리는 줄 알았습니다. 완전히 암호문이더군요.

다행히 그당시 제가 학교에서 컴파일러를 배우고 있던 때라 그나마 다행이었죠..



그렇다면 Valid 문서란 무엇을 나타내느냐?? 기본적인 조건에 무언가를 하나 더 지키고 있다는 것이겠죠..

그게 바로 DTD라는 겁니다. DTD란 Document Type Definition의 약자로서 문서의 타입을 정의하는 것을 말합니다.

혹시 HTML 문서에서 한번쯤 이런 것 보지 못했나요??



<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0//EN">



못봤나요?? 다시 한번 HTML소스를 보세요.. 직접 타이핑 한 것 말구 에디터로 만든 걸 보면 반드시 들어가 있을 겁니다.



어쨌든 그게 바로 DTD입니다. 문서의 타입은 정의해서 어디에 쓰는 걸까요?

HTML에서 기본적으로 모든 시작은 <HTML>로 합니다. 그죠..



그리고 <HTML>내에서 <HEAD>와 <BODY>가 나옵니다.

즉,,



<HTML>

  <HEAD>

  ....

  </HEAD>

  <BODY>

  ....

 

</HTML>



기본 구조가 위와 같죠.. 자 제가 이걸 어떻게 알았을까요... 당연히 HTML책이나 강좌에 나와 있죠..

그럼 어떻게 모든 사람들이 저렇게 사용할까요? 그건 바로 DTD에 있습니다.

DTD에 그렇게 하라구 나와 있거든요.. 즉 사용자는 DTD에 나온 대로만 쓰면 됩니다.



그런데 때로는 <HEAD>를 빼먹고 안쓰는 사람들 많죠..

HTML은 그래도 인정했었지만 XML에서는 유효한 문서가 아니라고 하죠.. (Non-Valid 문서)

즉, DTD가 있으면 반드시 그대로 해야 한다는 거죠.. 물론 빼먹을 수 있도록 DTD에서 선언할 수도 있지만요..



음.. 보통 질문을 많이 하는 내용중의 하나가 "Document Type Definition"과 "Document Type Declaration"의 차이를 물어보는 겁니다.

보통 DTD 문서를 "Document Type Definition"이라고 하지요..

그렇다면 "Document Type Declaration"은 무엇일까요?

이것은 XML 문서 내에서 <DOCTYPE> 요소를 사용해 DTD 문서를 선언하는 것을 말합니다.



즉, XML 문서가

<xml version='1.0'>

<DOCTYPE aaa system..>

<aaa>





이런 형태로 되어 있을때, <DOCTYPE>으로 선언한 부분을 "Document Type Declaration"이라고 하는 것이죠..  ^^



그러면, 다음 그림은 우리가 최종적으로 보게 될 XML문서의 내용입니다.





그럼 위와 같이 나타내지는 메모.xml의 내용을 살펴볼까요!!

<?xml version="1.0" encoding="euc-kr"?>
<?xml:stylesheet type="text/xsl" href="메모.xsl"?>
<!DOCTYPE 메모 SYSTEM "메모.dtd" >
<메모>
        <헤더>
                <송신자>&me;</송신자>
                <수신자>홍길동</수신자>
                <수신자>이순신</수신자>
                <날짜>
                        <년>2000</년>
                        <월>12</월>
                        <일>9</일>
                </날짜>
                <제목>XML의 기본개념 과 활용방안</제목>
                <키워드>XML</키워드>
                <키워드>문서구조</키워드>
                <키워드>DTD</키워드>
        </헤더>
        <텍스트>
                <내용>
                        이글은 XML과 관련된 연재입니다. 다음과 같은 차례로 이루어져 있습니다.
                </내용>
                <목록 타입="도형">
                        <항목>XML이란?</항목>
                        <항목>XML 문서의 처리 - 엘리먼트, 속성, 엔터티..</항목>
                        <항목>XML, XSL 그리고 웹브라우저</항목>
                        <항목>XML 응용 분야 및 발전 가능성</항목>
                </목록>
        </텍스트>
</메모>





위 XML 문서의 내용을 하나씩 설명해 드리도록 하겠습니다.

첨이 아니신 분은 여기를 건너 뛰어도 될 것 같습니다.

  <?xml version="1.0" encoding="euc-kr"?>



XML 선언이라는 부분입니다. 이 문서가 XML이라는 것을 가르쳐주고 있죠. 실제로 WML이나 SMIL과 같은 언어도

이러한 선언으로 시작하는 것을 확인해 볼 수 있을 겁니다.



version이란 현재 XML 스펙 1.0을 지원한다는 것이구요. encoding은 사용할 언어를 지정합니다.

우리는 euc-kr이나 ksc5601로 지정하면 한글을 사용할 수 있습니다.

만약 이부분이 빠지면 당근 한글을 사용하지 못하게 되지요....

  <?xml:stylesheet type="text/xsl" href="메모.xsl"?>



XML 문서에서 <? ... ?> 이런 형태로 사용되는 것을 PI라고 부릅니다. 우리말로는 처리명령이라고 하더군요.

그중에서 가장 많이 사용될 PI인데요.. 스타일쉬트를 지정하는 것입니다.

앞에서 XML은 문서의 구조를 나타내는 부분과 포맷팅, 즉 보여주는 부분이 서로 다르다고 하였죠.

바로 그 포맷팅을 담당하는 것을 가리키는 부분입니다.



만약 이부분을 빼고 문서를 IE에서 볼 경우 특정 포맷이 정해지지 않았기에 그냥 문서의 내용이 보여집니다.

한번 그 부분을 삭제하고 브라우저에서 읽어 보세요.. 아까하고는 다르지요??

  <!DOCTYPE 메모 SYSTEM "메모.dtd" >



위에서 DTD를 포함하고 있는 문서는 Valid 문서이다 라고 설명했죠. 그러한 DTD를 지정하는 부분입니다. 이 부분이 바로 "Document Type Declaration"이죠.

간단히 의미를 해석하자면 System 즉, Local PC에 있는 메모.dtd란 파일을 DTD정의로 사용하구요.

그 메모.dtd의 루트 엘리먼트가 "메모"라는 것입니다.



엉~~ 루트 엘리먼트가 모야???

먼저 엘리먼트가 무엇인지부터 살펴보죠.. 위의 XML문서에서 <메모><헤더><텍스트>와 같은 것이 보이죠.

이런 것을 엘리먼트라 합니다. 우리가 HTML에서 태그라고 했던 것 있죠.. 그걸 생각하면 쉬울 겁니다.

하지만 XML에서는

<헤더>을 시작 태그라 하구요. </헤더>를 닫는 태그라고 합니다.

그리고 <헤더>...</헤더>까지를 엘리먼트라고 하지요..



좀 이해가 되셨어요..



그리고 그중에서 특히 <메모>와 같이 가장 먼저 사용된 엘리먼트를 루트 엘리먼트라고 합니다.

문서를 트리구조로 만들 때 가장 위에 나타나게 되겠지요..

그럼 HTML에서 루트엘리먼트는 뭘까요??

당근 <html>이겠죠... 쿠쿠쿠~~ 쉽죠!!

  <송신자>&me;</송신자>



<송신자> 엘리먼트의 내용이 &me;라고 되어 있습니다. 이걸 엔터티 참조라고 하거든요.

실제 내용을 보면 이부분이 "김종민"이라고 바뀌어 있죠. 음~~ HTML에서 & 또는  정도를 생각하시면 될 것 같네요.

엔터티는 XML에서 좀더 복잡하고 다양하게 사용되지만 일단 간단한 문자열 대치정도로 생각해 두세요..

  <목록 타입="도형">



여기에서 타입="도형"이란 부분이 있죠.. 이것을 속성 노드라고 합니다. "타입"은 속성이름이구요.

"도형"은 속성값이 되지요.

HTML에서 < a href="xmlis.pe.kr">이 부분을 생각하면 금방 이해하실 수 있을 겁니다.



자! 오늘은 XML 문서의 예제를 보구요. 간단한 용어 설명을 했네요.

다음엔 XML의 구성요소에 대해서 좀더 자세히 살펴보도록 하죠..



자~ 그럼 더운 여름날 휴가철에 모두들 즐겁게 보내세요... 2002/08/02 From 미니
출처 : 미니의 XML DeveloperGroup (http://www.word.pe.kr)

'프로그램언어 > XML' 카테고리의 다른 글

6. XSL & XML  (0) 2008.06.02
5. DTD & XML  (0) 2008.05.28
4. DTD란?  (0) 2008.05.14
3. XML의 구성요소  (0) 2008.05.14
1.1 XML 이란?  (0) 2008.05.14

+ Recent posts