I. GİRİŞ
XML açılımı Extensible Markup Language (Genişleyebilir İşaretleme Dili)’dir.
XML, elektronik ticaret, elektronik veri değişimi, terdarik zinciri bütünleştirmesi, veri yönetimi, akıllı arama makinaları gibi bir çok alanda stratejik bir araç olarak kullanılacak basit ve esnek metin biçimi teknolojisidir. XML’in özellikleri veri yapılarını, içeriklerini ve kavramlarını platform, şirket ve dilden bağımsız bir yapıda temsiline imkan vermektedir. XML uygulamalarımıza özel kendi işaretleme dilleri tanımlamamızı sağlayan bir meta dildir.
Bu seminer notunda işaretleme dilleri ve tarihçesi, HTML dili ve sınırlamaları, XML dili ve XML tabanlı teknolojiler ve uygulamalar, XML söz dizimi (syntax) kuralları, XML DTD belge tipi tanımlamaları, XML şemaları, CSS ve XSL ile XML belgelerinin biçimlendirilmesi, XML belgelerinin işlenmesi gibi XML temel konular örnekler verilerek açıklanmıştır.
II. İŞARETLEME DİLLERİ VE TARİHÇESİ
XML’in ne olduğunu tanımlayabilmemiz için önce Markup Language (İşaretleme Dili) ne anlama geldiğini açıklamakta fayda var. Basılı yayının gelişmesiyle yayıncıların yazılı metinlerin baskı makinalarında nasıl bir şekilde biçimde yayınlanması için hazırladıkları notlar ve özel sembolller markup olarak ifade edilmekteydi. Bu metinin belirli kısımlarının özel bir anlam kazandırmak üzere işaretlenmesi işlemidir. Bu amaçla kullanılan işaretler, kurallar ve gramer kümesi markup language (işaretleme dili) tanımlanır. Bu tip işaretleme yapılarını biz bir çok ortamda görebiliriz. Örneğin ASCII kodlama standardının içerdiği bir çok kontrol karakteri veri iletişimi için kullanmaktadır. Kelime işlem programları bir metin’nin içerdiği kısımları, yazı tiplerini, font ve stilleri ayırmak için metin içeririsine gömülü bir çok işaret’leri içermektedir. Programlama dilleri fonsiyonları, data yapılarını, verileri ayırmak için bir takım sembolller veya işaretler kullanmaktdadır. Bu tip bir standard ayıraç, işaret veya etiketler kümesi kullanmadan taşınabilir ve paylaşılabilir bir uygulama geliştirilebilmesi çok güçtür.
Metin ve belgelerin kolay bir şekilde taşınabilmesi, paylaşılabilmesi ve işlenebilmesi için ilk işaretleme dili GML (Generalized Markup Language) 1960 sonlarında IBM’de yapılan araştırma çalışmaları sonunda ortaya çıktı. GML daha sonra ANSI (American Natitional Stardard Institute) 1978 te oluştuturlan bir grup tarafından geliştirilerek SGML (Standardized Generalized Markup Language) adı altında 1986 yılında ISO (the International Organization for Standardization) kurumunca uluslararası bir standard olarak kabül edildi [1]. SGML bir metin veya belge kümesinde kullanılan dilin gramer ve sözlük yapısını belirtmek için kullanılan bir dildir. SGML Amerikan hükümeti kuruluşlarında, havacılık ve otomobil gibi büyük endüstri kuruluşları ve basın endüstrisinde bir belgeleme standardı olarak kullanılmaktadır. SGML çok güçlü bir dil olmasına rağmen son derece karmaşık yapısı ve yüksek uygulama geliştirme maliyeti bu dilin yaygın bir şekilde kullanımını engellemiştir.
Tim Berners-Lee ve Anders Berlung 1989 yılında internet ortamında belge paylaşımını kolaylaştırmak için Web uygulamalarının temel öğelerinden biri olan HTML (Hypertext Markup Language) dilini geliştirdiler. HTML bir SGML uygulaması olarak geliştirildi. Diğer bir deyişle HTML dilinin yapısı SGML dilinde tanımlandı. HTML dili çok basit yapısı ile son derece başarılı oldu. Albert Einstein’nin dediği gibi her şey daha basit olmamalı ama mümkün olduğunca basitleştirilmelidir[2]. HTML dili bir belgenin içerdiği başlık, font, resim ve tablo gibi bilgileri bilgisayar ortamında standard bir şekilde görüntülemek ve biçimlendirmek için geliştirilmiş bir dildir. Belgenin istenen formatta sunulması tag (etiket) olarak ifade edilen işaretler ile sağlanmaktadır. Bu dilin geliştirilmesindeki temel amaç belgenin standard bir formatta görüntülenerek sunulmasıdır. Bu dilin yalnızca web tarayıcıları için sunum amaçlı olarak geliştirilmesi bugunkü web uygulamalarının gerekirdiği daha sonra açıklayacağımız bir çok kısıtlamalar XML dilinin geliştirilmesine yol açtı.
1996 yılında Word Wide Consortium (W3C, http://www.w3.org)’u SGML güç ve esnekliğini içereçek basit bir işaretleme dili oluşturmak amaçıyla XML dilini tasarlamaya başladı. Şubat 1998’de XML 1.0 bir standard olarak W3C tarafından yayınlandı. XML dili SGML dilinin bir çok özelliğini içeren basitleştirilmiş dildir. SGML dilinin bir alt kümesidir. XML SGML gibi bir meta dildir. Yani başka dillerin yapısını tanımlamakta kullanılan bir dildir.
III. HMTL : Biçimsel ve İçeriksiz
HTML dili bir belgenin formatlanması amaçıyla daha önceden tanımlanmış bir etiket (tag) kümesine sahiptir. Her bir etiket özel bir formatlama anlamı içerir. Şekil 1’deki HTML örneğine bakalım. Burdaki <P> etiketi bir paragrafın başını göstermektekdir. </P> ise paragrafın bitiş etiketidir. Tarayıcı bu etiketlere bakarak bu başlangıç ve bitiş etiketleri arasındaki metini bir paragraf olarak yorumlayarak buna göre biçimlendirme işlemini gerçekleştirecektir. <b> ve </b> ekiteleri ise bu iki etiket arasındaki metinin bold (kalın) fontta basımı sağlayaktır. <br> etiketi ise yeni bir satır başına geçilmesini ifade eden satır atlama etiketidir
Bu örnekte gördüğümüz gibi HTML dilindeki bir çok etiket yalnızca biçimlendirme ile ilgili tarayıcın kullandığı bir anlam ifade etmektedir. HTML’in bu yapısı esnek, güçlü ve çok amaçlı bilgi sistemlerinin geliştirilmesini engellemektedir. HTML’in bu anlamda getirdiği bu takım sınırlamalar şunlardır[2|:
- HTML genişleyebilir bir dil değildir. HTML daha öceden tanımlanmış sabit bir etiket kümesi içermektedir. Bu etiket kümesini uygulamara özgü kendimizin ekleyeceği yeni etketlerle genişletemeyiz.
- HTML yalnızca sunum amaçlıdır. HTML etiketlerinin bir çoğu tarayıcının metni yalnızca nasıl biçimlendirmesi ile ilgili bilgi içermektedir. Veri kopyalama, paylaşımı, iletişimi ve uygulama bütünlenleştirmesi gibi diğer ağ uygulmalarının gereksinimlerine cevap vermemektedir.
HTML belgeleri genellikle direkt olarak yeniden kullanılamazlar. Örneğin, bir hava tahminleri hakkında bilgi veren bir sitedeki bir HTML belgesindeki sıcaklık, ve hava tahminleri ile ilgili bilgileri kendi uygulamamızda kullandığımızı düşünelim. Kendi uygulamamız bu sayfanın yapısını inceleyerek bu bilgileri istediğiz formata dönüştürsün. Hava tahmini sitesindeki en ufak bir değişiklik olması durumunda bizim uygulamamızı değiştirmemiz gerekeçektir. Bunun temel nedeni bir HMTL belgesi içindeki bilgi içeriğiyle sunum yapısının birbirinden ayrılmamasıdır.
- HTML verilerinizin yalnızca bir “görüntüsü”nü sağlar. Kullanıcı isteklerine bağlı olarak bir HTML belgesindeki bilgilerin farklı formatlarda görüntülenmesini istersek bu işlem HTML ortamında çok zor olaçaktır. Bunun işlemi gerçekleştirmek için çok fazla script kodu yazmamız gerekçektir.
- HTML verileri çok az veya hiçbir anlamsal yapı bilgisi içermezler. Örneğin yukarıda vermiş olduğumuz adres örneğinde metin içeriği hakkında ise hiç bir bilgi yoktur. Bu metne bakarak bir uygulamanın bu metindeki hangi verinin ad, soyad veya posta kodu olduğunu anlaması zordur.
IV. XML NEDİR ?
XML’de HTML gibi işaretleme etiketlerini kullanan dildir. HTML ve XML arasındaki temel fark XML işaretleme etiketlerinin bilginin içeriğini tanımlamak için kullanılmasıdır. XML bir meta dildir. Diğer bir deyişle diğer yeni işaretleme dillerini tanımlamak için kullanılan bir dildir. XML ile herhangi bir uygulama için bir XML belgesinin içinde bulunacak verinin içeriği ve içerdiği veri tiplerini tanımlayacak uygulamaya özel bir işaretleme dili tanımlayabilirsiniz. Meta veri (Metadata veya Metainformation) veri hakındaki bilgidir. XML etiketleri veri hakındaki meta bilgiyi tanımlamaktadır. Şekil 2’deki XML adres listesi belgesi örneğindeki etiketler adres içinde geçen veriler hakkında bilgi vermektedir. Başlagıç <contact> ve bitiş </contact> etiketleri arasındaki verilerin adres bilgisi olduğunu bildirmektedir. Bu belgenin içindeki başlagıç ve bitiş etiketlerine bakarak bir uygulama bu bilgilerin ne gibi bilgi içerdiklerini kolay bir şekilde çıkarabilir. Örneğin <city> başlangıç ve </city> arasındaki “New yok” verisinin şehir bilgisi olduğunu kolayca anlaşılabilir.
Belgenin web tarayıcılarında nasıl formatlanacağı konusunda herhangi bir bilgi yoktur. Belgenin formatlanması daha sonra göreceğimiz CSS veya XSL teknolojileri yapılabilir.
Şu ana kadar bu örnekte belge içinde hangi etiketler hangi yapıda kullanılabilir belirmedik. Bir belge içerisinde her hangi bir etiket ismi verip bu etiketi belge içinde kullanabilirmiyiz? Elbeteki hayır. Bir uygulamadaki XML belgesinin yapısı ve içereçeği etiketler o uygulama için geliştirilmiş olan olan özel işaretleme dili ile tanımlanır. Bu işaretleme dilinin yapısı ise XML DTD (Document Type Definition) veya XML schema olarak adlandırılan belge tanımlama dosyalarında belirtilir. Şekil 3’te yukarıdaki adres listesi örneği için tanımlanmış bir DTD dosyasını göstermektedir. Bu dosyada bu DTD’ye göre oluşturulmuş bir adres listesinde hangi etiketlerin bulunabileçeğini, bu etiketlerin hangi etiketleri içerebileceği gibi bilgiler vermektedir. İlk satır <adressbook> etiketinin bir veya daha fazla <contact> etiketi içereceğini belirmektedir. İkinci satır ise bir <contact> etiketinin içinde geçecek elemanları belirlemektedir.
V. XML TABANLI TEKNOLOJİLER VE UYGULAMALAR
XML değişik veri, kavram ve içeriklerin tanımlanması ve temsil edilmesi için uygun bir ortam sunmaktadır. Bu nedenle XML farklı alanlarda uygulama verilerinin tanımlanması ve taşınması için üretici, dil, ve platformdan bağımsız stratejik bir araç olarak hızla yaygınlaşmaktadır. Aşağıda XML’in kullanıldığı ve kullanılaçağı bazı temel uygulama alanları tanıtılmıştır.
Internet Arama Makinaları
Internet çok büyük bir haçimdeki yapısal olmayan veri içermektedir. Bir arama makinasının (search engine) ingilizçe “chip” kelimesini aradğını düşünelim. Karşımıza “chip” kelimesini içeren binlerce doküman gelecektir. Bu dokümanlar patates “chip”leri, bilgisayar “chip”leri veya “chip” isimli kişiler hakında olabilir. Şu anda Internet belgeleri HTML ortamında saklandığından veri içeriği hakkında her hangi bilgi yoktur. XML yaygın bir şekilde Internet’te belge saklama ortamı olarak kullanıldığında, arama makinaları veriler hakında verilen bilgileri (metadata) kullanarak daha akıllı seçimler sunabilecektir.
Aygıt ve Uygulamadan bağımsız Veri Erişimi
Şu andaki Web ortamındaki HTML belgelerine masaüstü bilgisayarlardaki tarayıcı (browser) programları kullanarak erişilmektedir. Bu yapı değişmeye başlamıştır. Cep telefonları ve kişisel sayısal yardımcı PDA (Personel Digital Assistant) gibi araçlar ile bugün web erişimi hızla artmaktadır. Bu araçlardaki görüntü, band genişliği, bellek ve işlemçi sınırlamaları Web’te yeniden bir yapılanmayı gerektirmektedir.
HTML dili belgelerin Web tarayıcılarında gösterilmesi amaçı ile geliştirlmiştir. XML belge içeriğini belge sunumundan ayırmaktadır. XML ortamındaki belgeler aygıtın yapısına bağlı olarak istenilen şekilde formatlanarak sunulabilir. XML tabanlı bilgilere erişim cep telefonu gibi bir aygıtla erişileceği gibi bu iş amaçlı bir web uygulaması ilede olabilir. Bu uygulama XML ortamındaki bilgi içeriğini alarak istediği şekilde kullanabilir veya formatlayabilir. Örneğin aşağıda bir ürün hakındaki bilgiler XML formatında verilmiştir. Bu ürün hakkındaki bilgiler Şekil 4’te görüldüğü gibi XML işlemcisi tarafından farklı ortamlarda sunulabilir.
Elektronik Veri Değişimi ve Elektronik Ticaret
XML’in en fazla ilgi çeken tarafı e-ticaret, tedarik zinciri yönetimi ve iş akışı (workflow) yönetimi gibi elektronik iş web uygulamalarında bir veri değişim formatı olarak kullanılmasıdır. Bugünkü bilgisayar iletişimindeki çok büyük gelişimlere ve birikime rağmen, bilgisayar sistemlerindeki ve veritabanlarındaki farklı formatlardaki verilerin şirket içi ve şirketler arası taşınması ve işlenmesi en büyük problemlerden birisidir. Bu verilerin XML formatına dönüştürülerek taşınması bu problemin çözümünü kolaylaştırmaktadır.
Basın ve Yayıncılık
XML basın ve yayıncılık için geliştirilmiş olan SGML dilinin basitleştirilerek türetilmiş bir dil olduğundan bu konuda aynı amaçla kullanılabilir. XML formatında saklanan belgeler bir çok farklı ortama XML araçlarını kullarak dönüşürülebilir ve kullanılabilir. Klasik yayıncılığın yanı sıra XML yeni elektronik yayıncılıktada kullanılabilir. Elektronik yayın ortamındaki görüntü, video, ses ve diğer sayısal veri nesneleri XML ile formatlanarak saklanabilir, taranabilir ve sunulabilir.
Şirket Uygulamarı Bütünleştirmesi
Şirket Uygulamaları Bütünleştirilmesi kavramı farklı uygulamaların tek bir uygulama gibi davranması olarak ifade edilebilir. Bu işlem farklı sistemlerdeki veri kopyalarının ve dağıtık bir yapıdaki verilerin doğru zamanda ve doğru yerde bulunmasını gerektirir. Örneğin bir muhasebe sistemi ile satış sistemini birleştirmek için satış siparişi bilgilerinin faturaların oluşması için muhasebe sistemine aktarılması gerekebilir. Aynı şekilde fatura verilerininde muhasebe sistemine aktarılması gerekebilir. Bu aktarma işlemleri doğru bir şekilde yapıldığında her bir iş hareketi otomatik olarak gerekli uygulama sistemlerine işlenerek güncellecektir.
Yazılım Geliştirme
XML büyük çaplı uygulama gelişmede uygulama mimarilerinin paylaşımını kolaylaştıracaktır. OMG (Object Management Group) bir XML tabanlı bir uygulama olan XMI (XML Metadata Interchange) spesifikasyonunu kullanacağını belirmiştir. XMI, UML (Unified Modelling Language) kullanarak tasarlanmış olan uygulamaları tanımlamada kullanılan bir dildir. XMI, geliştirme ekibinin çok farklı uygulama geliştirme araçlarını kullanarak, tek bir UML modelinin paylaşımına imkan vermektedir. Bu yazılım geliştirme sürecinde geliştirme ekibi arasındaki iletişimi artırarak geliştirme sürecini kısaltmakta ve ekibi daha üretken kılmaktadır.
Yazılım geliştiricileri XML meta bir dil olduğundan uygulamalarının gerektirdiği yeni dilleri gelişitirebilir. Bu dillerde tanımlanmış olan verileri ve yapıları hazır olarak bulunan XML kütüpaneleri ve araçları ile kolaylıkla işleyebilir.
Z DİZİMİ (SYNTAX)
XML belgeleri işaretleme ifadeleri ve veri içeriğinden oluşan bir veri dosyası veya paketidir. İşaretleme ifadeleri elemanlar (elements), varlık referansları (entity refererences), açıklamalar (comments), işleme komutları (processing instructions), CDATA bölümleri ve veri tipi tanımlamalarından (document type declaretions) oluşur.
XML’de geçen temel işaretleme ifadelerini detaylı incelemeden önce aşağıdaki Şekil ‘teki örneği inceleyelim. Bu örnekte XML dilinde tanımlanmış basit bir elektronik posta verilmiştir. Belgenin ilk satırı <?xml … ?> her zaman tanımlanması gereken XML işlem komutu deklarasyonudur. Bu belgenin bir XML belgesi olduğunu ve hangi versiyonu kullandığını belirmektedir. İkinci satır opsiyonel olarak tanımlanabilen belge tipi deklarasyonunudur. Bu belge için tanımlanmış olan DTD (Veri Tipi Tanımlama) dosyasının isminin e_posta.dtd olduğunu ifade etmektedir. Bunların altındaki kısım XML belgesinin gövdesini oluşturmaktadır. XML belgesi gövdesi hiyerarşik bir ağaç yapısında oluşmuş belge elemanlarından oluşur. Her bir eleman bir başlangıç ve bitiş etiketi içerir. Örneğin aşağıdaki tarih elemanı <tarih> başlangıç etiketini, 7 Eylül 2000 karakter verisini ve </tarih> bitiş etiketindan oluşmaktadır. Elemanlar diğer elemanları veya karakter verileri içerebilir. Bu örnekte e_posta elemanı kime, kimden, tarih, konu, ve mesaj elemanlarını içermektedir. Bir belgenin en üst seviyesinde bulunan eleman kök eleman olarak adlandırılır. Bu örnekte kök eleman e_posta’dır.
Elemanlar (Elements)
Elemanlar XML dilinin en temel yapı taşlarıdır. Bir eleman veri içeriğini kapsayan bir kutudur. Karakter verileri, diğer elemanları veya diğer işaretleme yapılarını içerebilirler. Elemanlar etiketlerle ayrılırlar. Her bir etiket bir eleman tip ismi (element type name) içerir ve bir çift (“<>”) açı parantezle içe alınır. Eleman tip isimlerini oluşturmakta olan kurallar diğer programlama dillerindeki isim kurallarına benzemektedir. Her bir isim bir harfle veya alt çizgi (_) başyababilir. Tire (-) veya sayı ile başlayan isimler kulanılamazlar.
Boş elemanlar (empty elements) haricindeki her bir elemanın bir başlagıç etiketi bir de bitiş etiketi bulunur.
Başlangıç Etiketleri
Bir elemanın başlama ayıraçı başlangıç etiketi (start-tag) olarak adlandırılır ve bir çift (“<>”) açı parateziyle kapatılır. Aşağıda bir bazı doğru başlangıç etiketleri verilmiştir.
|
Unutulmaması gereken bir diğer kural XML dili harflerin büyük veya küçük olmasına duyarlı (case sensitive) olduğudur. Örnekteki <Kitap> ve <kitap> etiketleri aynı değildirler.
Bitiş etiketleri
Bir elemanın bitiş ayıraçı bitiş etiketi (end-tag) olarak adlandırılır. Bitiş etiketi eleman tip ismi öcesinde bir bölü (“/”) karakteri içerir ve açı parantezleri ile kapatılır. Aşağıda bitiş etiketi örnekleri verilmiştir.
|
XML’de her bir başlangıç etketi bir bitiş etiketi ile mutlaka kapatılmalıdır. Başlangıç bitiş etiketi ile kapatılmış bir tam XML elemanı aşağıdaki gibidir.
|
Boş Eleman Etiketleri
Aşağıdaki örnekteki ilk satırda olduğu gibi boş elemanlar (empty elements) her hangi bir içerik içermezler. Boş etiketler istenirse etkiketin sonuna tek bir bolü (/) işareti eklenerek kısatılmış bir biçimde gösterilebilir. İkinci satırda bunun bir örneği verilmiştir.
|
Belge Elemanı
XML belgeleri mutlaka hiyerarşik etiket yapısında olmalıdır. Etiket hiyerarşisi içindeki en üst sevyideki etiket kök etiket (Root tag) veya belge kökü (Document root) olarak adlandırılır. Kök etiketin oluşturduğu eleman Belge elemanı (Document Element) olarak adlandırılır. Bu eleman belgenin ağaç yapısındaki diğer bütün elemanları içine alır ve diğer bir elemanın içinde bulunamaz. Örneğin Şekil 4’te verilen elektronik posta örneğinde belge kökü e_posta’dır.
Elemanlar iç içe yuvalandığında yuvalama (nesting) kurallarına uymalıdırlar. Yoksa bu bir XML belgesinin hiyerarşik ağaç yapısını bozacaktır. Aşağıda bir yanlış yuvalama örneği verilmiştir.
|
Aşağıda doğru bir yuvalama örneği verilmiştir.
|
Özellikler (Attributes)
Elemanlara eklemek istediğimiz ek bilgiler özellikler olarak ifade edilir. Özelikler başlangıç etiketi içerisinde isim ve değer ikilileri olarak geçer. Aşağıda bir özellik örneği verilmiştir:
|
Buradaki kitap_no kitabın bir özelliğidirr. Özellik değerleri mutlaka çift tırnak (“) veya tek tırnak (‘) içine alınmalıdır.
Karakter Veri
Bir elemanın başlangıç ve bitiş etiketleri içinde geçen metin içeriği karakter veri (character data) olarak adlandırılır. XML içinde özel amaçlı olarak kullanılan (&,<,>,”,’) karaterleri olduğu gibi bir karakater veri içerisinde geçemezler. Bu karakterler işaretleme etiketleri içinde özel amaçlarla kullanılan ayıraçlardır.
XML’de HTML’den farklı olarak etiketler içine yazılmış olan veri içerisinde geçen boşluklar (White Space) korunur ve uygulamalara iletilir. Etiket tanımları içerisinde veya özellik tanımı içerisinde geçen boşluklar ise HTML’de olduğu gibi parser tarafından yok edilir.
Karakter ve Varlık referansları
SGML ve HTML gibi ASCII karakter seti içinde karakterleri göstermek için XML iki yöntem kullanmaktadır. Birinici yöntem karater refereranslarıdır. Karater referansları gosterilecek karateri onluk bir sayının başına “&#”, onaltılık bir sayının başına ise “&#x” ekleyerek gösterme imkanı sağlar. Örneğin copyright karateri ã ondalık olarak “©” veya onaltılık olarak “©” XML’de gösterlebilir.
Varlık referansları verilecek bir isim vasıtasıyla istenilen karaterleri göstermek için kullanılır. Varlık referansları bir amersend (&) karateri, bir isim ve noktalı virgülden (;) oluşur. Örneğin XML’de özel olarak kullanılan (&,<,>,’,”) karakterleri (& < > ' ") varlık referansları ile gösterilir. Bu referanslar XML de daha önce tanımlanmış standard referanslardır. Bu referanslar haricinde özel olarak kullanmak isteiğimiz varlık referansları DTD içinde tanımlanmalıdır.
Açıklamalar (Comments)
Açıklamalar HTML’de olduğu gibi “<!–“ ile başlar ve “–>” ile biter. Açıklamalar bir XML belgesinin herhangi bir kısmında geçebilir ve belgenin bir parçası sayılmazlar.
İşlem Komutları (Processing Instructions)
XML belgelerini kullanan uygulamalara her hangi bir komut geçilmesi istenildiğinde bu işlem komutları ile yapılır. İşlem komutları aşağdaki yapıya sahiptir:
|
İşlem komutları XML işlemiçisi tarafından uygulamaya iletilir. İşlem komutları açıklamalar gibi bir XML belgesinin parçası sayılmazlar.
CDATA bölümleri (CDATA Sections)
CDATA bölümleri XML’de kullanılan işaretleme ifadelerinin göz ardı edilmesi gereken metinleri yazmada kullanılır. XML parsır’ı bu bölümde metin içerisinde yer alan işaretleme ayıraçlarını ve etiketlerini normal karaterker olarak algılar. Bir CDATA bölümü şu yapıya sahiptir:
|
Bu yapıda “…” olarak ifade edilen kısım “]]” hariç herhangi bir metini içerebilir. Aşağıda bir CDATA bölümü örneği verilmiştir.
|
XML Veri Tipi Tanımlamaları (DTD)
Belge Tipi Deklarasyonu (Document Type Declaration)
Belge tipi deklarasyonları bir XML belgesinin giriş kısmında tanımlanan belgenin gramer tanım kurallarını belirleyen hangi harici ve dahili DTD (Document Type Definiton)’yi kullandığını belirtir. Bu kısım varlık referansı tanımlamaları gibi ek bilgilerde içerebilir. Harici belge tipi deklarasyonları şu formatta olabilir:
|
Bu tanımdaki kök_eleman_ismi belge DTD’sinde en üst seviyede tanımlanan kök elemanı belirtir. Sistem_tanımlayıcısı ise harici olarak kullanılan DTD’ye URI (Uniform Resource Idenifier) bir referansı içerir. İkinci satırdaki formatta XML parser’ı ilk önce public_tanımlayıcısı’nı kullarak bir URI referansı oluşturmaya çalışır. Eğer bu mümkün olmazsa sistem_tanımlayıcısı’ndaki referansı kullanır. Aşağıdaki Şekil 2’de verilen adres belgesinin belge tipi deklarasyonu kısmı gösterilmiştir:
|
İlk satır adres belgesindeki kök elemanın adressbook olduğunu belirtmektedir. Belgenin DTD’si http://xyz.com/AddressBook.dtd dosyasında saklanır. Bunun haricinde köşeli parantez içinde tanımlanan kısım ise varlık referanslarını tanımlamaktadır. Bu kısımda istenirse dahili belge tipi tanımlamalarıda bulunabilir.
İyi Oluşmuş (Well-formed) ve Doğru (Valid) Belgeler
XML söz dizimi (syntax) kurallarına uyan XML belgeler iyi-oluşmuş (Well-formed) belgeler olarak adlandırılır. Eğer belge için tanımlanmış olan DTD’de geçen gramer kurallarına uyuyorsa bu durumdaki belgelerde doğru (Valid) belgeler olarak adlandırılır.
VII. DTD (DOCUMENT TYPE DEFINITION) BELGE TİPİ TANIMLAMALARI
DTD’ler bir belgenin yapısını belirlerler. XML’in ilk harfinde geçen genişleyebilir kelimesinin (Extensible – X) anlamını ifade eden yeni yapılar tanımlamamıza imkan verir. Herhangi bir alandaki uygulamalarda kullanılacak yeni işaretleme dillerini (markup languages) DTD’ler ile geliştirebiliriz. Bu amaçla geliştirilmekte şu anda onlarca XML işaretleme dili vardır. Bu diller XML uygulaması (application) veya XML sözlüğü (vocabulary) olarak anılmaktadır. XML sözlükleri bir alandaki bilgi değişimi ortamını sağlamak için tanımlanmış işaretleme dilleridir. Bazı XML sözlükleri örnekleri aşağıda verilmiştir:
- Synchonized Multimedia Integreration Language (SMIL)
- Chemical Markup Language (CML)
- Bioinformatic Sequence Markup Language (BSML)
- Common Business Library (CBL)
Bu yeni diller için tanımlanan DTD’ler bu dilin hangi etiketleri içerbileceği, etiketlerin sahip olabileceği özellikleri, hangi elemanların diğer hangi elemanları içerebileceği gibi dil yapısı bilgilerini (gramer) içerir.
Bilgisayar ortamında dillerin gramer’leri genellikle EBNF (Extended Backus-Naur Form)’da tanımlanır. XML belirtimide (XML Specification) original olarak EBNF notasyonunda belirtilmiştir. XML 1.0 belirtimi http://www.w3.org/TR/REC-xml adresinden elde edilebilir. EBNF dili yapı kurallarını içerir. Her bir yapı kuralının sol tarafı yapının ismini sağ tarafı ise yapıyı tanımlar. Bir kişinin bir isminin şart olmasının gerektiğini ve opsiyonel olarak telefon numaralarının bulunabileceğini EBNF’de şu şekilde ifade edebiliriz.
|
Aynı yapı DTD’de şu şekilde tanımlanabilir.
|
Bir XML belgesinin yapısı DTD’de aşağıda verilan dört çeşit işaretleme ifadesi ile tanımlanır.
DTD ifadesi |
Anlamı |
ELEMENT ATTLIST ENTITY NOTATION |
Bir XML elemanı tanımlar. Bir eleman tipinin alabileceği özellikleri tanımlar. Belli bir içeriğin bir isme bağlanarak o isimle ilişkilendirilmesini sağlar. XML hariçi içeriğin tanımlanmasını sağlar. Bu tanımlaran içerik XML belgesinin bir parçası olarak parse edilmez. |
Elemanlar
Elemanlar bir XML belgesinin en temel yapılarıdır ve ELEMENT etiketi ile tanımlanırlar. Dört çeşit eleman tipi vardır:
· Empty (Boş) : Eleman herhangi bir içerik içermez. Elemanın özellikleri olabilir.
· Element Only (Yalnızca Eleman) : Eleman yalnızca alt seviye (child) elemanları içerebilir.
· Mixed (Karışık) : Eleman alt seviye elemanlar ve karakter veri karışımını içerebilir.
· Any : Eleman DTD’in izin verdiği içeriği içerebilir.
Boş (Empty) Elemanlar
Boş elemanlar aşağıdaki formatta tanımlanır.
|
Örneğin
|
Boş eleman XML belgesi içerisinde daha önce açıklandığı gibi eğer bir özelliği yoksa
aşağıdaki ilk iki satırdaki gibi geçecektir:
|
Yukarıdaki örnekte alttaki iki satırda img elemanı src adlı bir özellik içermektedir.
Yalnızca Eleman İçeren (Element Only) Elemanlar
Bu tipteki elemanlar aşağıdaki formattadır.
|
Bu yapıda İçerik-Modeli yalnızca bu elemanın altında kalacak alt elemanları içerebilir.
Örneğin Şekil 4’te verilen elektronik posta kök elemanı e-posta’nın tanımı aşağıdaki gibidir.
|
Bu örnek e-posta elemanı kime, kimden ve mesaj alt elemanlarını mutlaka gösterilen sırada XML belgesi içinde geçmesi gerektiğini göstermektedir. Tarih ve konu elemanları ise opsiyoneldir. Bu elemanların opsiyonal olduğunu (?) sembolü göstermekdedir. XML’de çeşitli amaçlarla kullanılan sembollerin anlamları aşağıda listelenmiştir:
Eleman Tanımı
|
Anlamı
|
A?
A+
A*
A,B
A | B ( ) |
Opsiyonel; A alt elemanı bir defa veya hiç gözükmeyebilir. A alt eleman mutlaka bir defa veya daha fazla gözükür. A alt eleman sıfır veya daha fazla gözükebilir. B elemanı A’dan sonra gözükmelidir. A veya B’den bir tanesi gözkebilir. Paratez içinde geçecek elemanları guruplar. Örneğin (A,B)+ ifadesi A ve B’nin ardışık olarak bir veya daha fazla geçeceğini götermektedir. |
Aşağıdaki bu sembolleri kullanan bir özgeçmiş elemanı örneği verilmiştir:
|
Karışık (Mixed) Elemanlar
Karışık elemanlar hem karakter veri hemde alt elemanları içerebilirler. Karakter veri #PCDATA terimi ile gösterilir ve parsed karakter veri anlamındadır. Aşağıda Karışık eleman örnekleri verilmiştir:
|
İlk satırdaki ifade konu elemanının yalnızca karakter veri içereçeğini göstermektedir. Bu tip yalnızca veri içeren eleman tanımlarında #PCDATA parantez içine alınmalıdır.
İkinci satırdaki karmaşık not elemanın karakter veri, tarih veya konu elemanlarından oluşabileceğini göstermektedir. Aşağıda buna bir örnek verilmiştir.
|
ANY elemanları
ANY tanımının formatı aşağıdaki şekildedir.
|
ANY elemanları herhangi bir yapıya sahip değildir. ANY elemanı karakter veri, tanımlanmış elemanlar veya bunların bir karışımını içerebilir. ANY elemanları her hangi bir yapı belirtmediği için kullanılması tavsiye edilmez.
Özellikler (Attributes)
Daha öncede belirtildiği gibi özellikler elemanlar hakında ek bilgi tanımlamak için kullanılır. Bir eleman hakkındaki özellik bilgileri aşağıdaki formatta tanımlanır.
|
Bir özellik bir isim ve tip bilgisini içerir. Default bir değer olabilir veya özellik kullanımı hakkında bilgi verir. Dört çeşit default değer tipi aşağıda verilmiştir.
Default
|
Anlamı
|
#REQUIRED #IMPLIED
#FIXED Değer
Değer |
Özellik her zaman tanımlanmalıdır. Özellik opsiyoneldir.
Özellik sabit bir Değer’e sahiptir. Özellik eleman içinde tanımlı olmazsa, parser bu sabit değer’in olduğunu varsayar. Özellik eleman içinde tanımlı olmazsa, parser bu değer’in olduğunu varsayar. Eğer tanımlı ise özellik farklı bir değer içerebilir.
|
Örneğin aşağıdaki örnekte Kitap elemanının BasımTarihi diye bir özelliğinin olduğu ve bu özelliğin karater veri olduğu (CDATA) belirtilmektedir.
|
Bu özellik bir XML belgesi içinde şu şekilde geçebilir:
|
Aşağıdaki örnek kitap Basım-Sayısı özelliğinin opsiyonel olduğunu göstermektedir.
|
Aşağıdaki örnek deniz elemanının renk özelliğin sabit olarak mavi değerine sahip olduğunu göstermektedir.
|
Aşağıdaki örnek elma elemanının renk özelliğinin default olarak kırmızı olduğunu göstermektedir.
|
XML 10 değişik özellik tipini destekler. Bu özellik tipleri şunlardır.
Özellik Tipi
|
Anlamı
|
CDATA
Enumarated
NOTATION
ENITITY
ENTITIES
ID
IDREF
IDREFS
NMTOKEN
NMTOKENS
|
Karakter veri (Unparsed) Özelliğin sahip olabileçeği değerler kümesi DTD’de tanımlanmış herhangi bir notation. Harici bir varlık. Bir den fazla boşlukla (white space) ayrılmış varlıklar. Bir belge içerisinde geçebilecek tek tanımlayıcı bir değer (unique identifier). DTD’te tanımlanmış olan bir ID’ye olan referans. Boşlukla (white space) ayrılmış ID’ler serisine referans. XML token karaklerlerinden (harf, sayı, nokta, tire, iki nokta, alt cizgi) oluşan bir isim. XML token karakterlerinden oluşan boşlukla ayrılmış bir çok isim. |
Enumerated özellikler bir dizi değer kümesi içerir. Özellik bunlardan bir değeri alabilir:
Aşağıdaki örnek kalem elemanının renk özeliğininin mavi, kırmızı, yeşil veya beyaz olabileceğini göstermektedir. Eğer bir renk seçilmezse default olarak kırmızı renk alınır.
|
Aşağıdaki örnek DTD’de tanımlanmış olan notation’ları özellik olarak kullanmaktadır.
Notation XML harici veri tiplerini tanımlamakta kullanılır. Bu örnek resim formatının gif veya jpeg olabileceğini belirtmektedir.
|
ID tipindeki özellikler değerleri bir belge içerisinde yalnızça bir defa geçebilir. Bu bize bir elemanı unique olarak tanımlamamızı sağlar. Örnegin personel diye bir elemanımız olsun. Her personel personel-no adlı bir özellik içersin. Her personelin numarası farklı olacağından bu özellik ID olarak tanımlanır.
|
IDREF, ID tipindeki elemanlara referans vermemizi sağlar. Örneğin mühendis adlı bir elemanımız olsun. Mühendis ile personel arasındaki bire bir ilişkiyi IDREF ile belirtebiliriz.
|
Bu bize mühendisin personel bilgilerini personel elemanından elde etmemizi sağlar. Aşağıda bir XML belgesi örneği verilmiştir.
|
IDREFS iki eleman arasındaki bire çoklu ilişkileri göstermekte kullanılabilir.
Örneğin proje-gurubu adlı bir elemanımız olsun. Bir proje gurubu bir çok personel içerecektir. Bu ilişkiyi şu şekilde belirtebiliriz:
|
Bu yapıdaki bir XML belgesi aşağıda verilmiştir. Bu belge 12345, 67891, 23456 nolu personelin proje gurubunda yer aldığını belirtmektedir.
|
Özellik değerlerininin token olarak varsayılması gereken durumlarda NMTOKEN veya NMTOKENS tipini kullanılır. Token boşluk içermeyen bir değerdir. XML parser’ı bir özelliği token olarak işlemesi durumumda aradaki boşlukları (white space) tek boşluğa indirger ve baş ve sondaki boşlukları siler. Bu işlem özellik değeri normalizasyonu (attribute value normalization) olarak adlandırılır. Aşağıda bir çok token içeren bir NMTOKENS özellik tipi tanımı ve XML ifadesi verilmiştir.
|
Varlıklar (Entities)
Varlıklar herhangi bir veri parçasına bir isim vererek bu veri parçalarına referrans vermemizi sağlar. Bunu C dilindeki DEFINE fonksiyonu gibi düşünebiliriz. Varlık tanımlamaları bir defa tanıladığımız bir değeri bir çok yerde ismi ile refereans vererek tekrar kullanabiliriz. Üç çeşit varlık tanımlaması vardır:
- Genel Varlıklar (General Entities)
- Parametre Varlıklar (Parameter Entities)
- Karakter Varlıklar (Character Entities)
Genel Varlıklar
Genel varlıklar bir metin parçasına bir isim vererek bu isimle metini kullanmamızı sağlar.
Örneğin aşağıda bir şirket ismi için yapılmış tanımlama gösterilmiştir.
|
Tanımlamayı aşağıdaki gibi ismin başına (&) harfi ve sonunna (;) ekleyerek kullanabiliriz.
|
Bu ifadedeki &şirket referansı tanımlamadaki metinle yer değiştirecektir.
Genel varlık tanımlamalarını harici bir dosyaya ulaşmak içinde kullanabiliriz. Örneğin aşağıdaki tanımlaman readme.txt dosyasına referans tanımlamaktadır.
|
SYSTEM ve URL dosyanın bulunduğu yeri belirtmektedir.
Parametre Varlıklar (Parameter Entities)
Genel varlık tanımlamaları XML belgesi içinde bir metin için tanımladığımız isimle belgenin içinde yer almasını sağlar. Parametre varlık tanımlamaları aynı işlevi bize DTD’nin içinde yapmamızı sağlar. Parametre varlık tanımlamaları aşağıdaki formattadır:
|
Aşağıdaki örnekte boyut isimli bir parametre tanımı yapılmıştır.
|
Parametre varlıkları varlık ismi başına (%) sonuna (;) konarak DTD içinde referans edilir. Aşağıda boyut’a yapılmış olan referansları görmekteyiz.
|
Her üç eleaman tanımındada %boyut; isminin geçtiği yerlerde (uzunluk genişlik yükseklik) metni yer alaçaktır.
Karakter Varlıklar (Character Entities)
Karakter varlık referansları verilecek bir isim vasıtasıyla istenilen karaterleri göstermek için kullanılır. Karakter varlık referans tanımlamaları aşağıdaki örnekte olduğu gibi yapılır:
|
Bu tanımlamada ASCII kodlamada 169 copyright karakterini (ã) belirtmektedir. Karakter varlık referansları bir amersend (&) karakteri, bir isim ve noktalı virgülden (;) oluşur. XML metninde ©right; yazdığımız yerler ã sembolü ile yer değiştirecektir.
Notation (Gösterim)
Notation tanımlamaları XML harici verinin ve bu harici ile ilişkindirilecek bir yardımcı uygulamanın (helper application) tanımlanmasını sağlar. XML parser XML verisi üzerinde parse işlemini yapar. XML harici verilerin işlenmesi, örneğin gif formatında tanımlanmış bir resim verisini, ancak bu veri formatları ile ilişkilendirilecek bir uygulama ile yapabilir. Aşağıdaki örnekte jpg ve gif formatındaki tanımlanmış verileri ilgili uygulamalarla ilişkilendirmektedir.
|
Bu notation jpg dosyalarını jpgviewer.exe, gif dosyalarının gifviewer.exe uygulaması ile işlenmesi gerektiğini belirtmektedir.
VIII. XML ŞEMALARI (XML SCHEMAS)
XML şemaları XML belgelerinin yapısını DTD’te olduğu gibi tanımlada kullanılan yeni bir yöntemdir. World Wide Web Konsonsiyumu (W3C) DTD’nin bazı sınırlamaları nedeniyle yeni bir alternative olarak 1998 yılında XML-Data note yayınladı. XML-Data note’u belge yapılarının bir XML sözlüğü olarak tanımlanmasını önermiştir. Bu yeni belge yapısı tanımlama yöntemi XML şema (XML Schema) olarak adlandırılmakta ve Microsoft tarafından desteklenmektedir.
|
XML şemaları ilgili iki tane Working Draft yayınlanmıştır. Bunlar şunlardır:
- XML Schema Part 1 : Structures (http://www.w3.org/TR/xmlschema-1/)
- XML Schema Part 2 : Datatypes (http://www.w3.org/TR/xmlschema-2/)
XML şemaları bir XML sözlüğü olarak tanımlandığından normal bir XML belgesi olarak işlenebilir ve parse edilebilir. Bunun yanında bir çok veri tipini desteklemesi, açık bir model olarak genişleyebilmesi, katılım (inheritance) ilişkilerini desteklemesi gibi avantajları vardır. Bu yöntem gelişme aşamasında olması nedeniyle henüz son şeklini (recommendation) alamamıştır.
Şekil 5 bir adres listesi belge yapısını tanımlayan DTD’yi ve bunun altında aynı amaçla geliştirilmiş olan bir XML şemasını vermektedir.
|
|||
IX. CSS ve XSL ile XML sunumu
Daha önce bahs ettiğimiz gibi XML belge içeriği ve sunumu birbirinden ayırmıştır. XML belgelerinin görsel olarak biçimlenlendirilerek sunumu CSS (Cascading Style Sheets) veya XSL (eXtensible Style Language) kullanılarak gerçekleştirilir.
CSS (Cascading Style Sheets)
CSS HTML ve XML belgelerini görüntüleme amaçıyla kullanılan bir biçimleme dilidir. CSS biçim sayfaları (sytle sheets) belge elemanlarına uygulanacak olan bir kurallar kümesi içerir. Her bir kural elemanların nasıl biçimlendirleceğini belirler. Biçim kuralları aşağıdaki yapıya sahiptir:
|
Özellikler (properties) seçicinin (selector) belirtiği elemanların nasıl formatlanaçağı konusunda biçimleme ifadeleri içerir. Aşağıdaki HTML paragrafının mavi renkte, Arial fontunda 14pt büyüklükte göstermek istediğimizi varsayalım.
|
Bu pararafı istediğimiz şekilde formatlayacak bir CSS kuralı örneği verilmiştir:
|
HTML elemanlarının nasıl biçimlendirileceğini CSS kuralları kullanarak belirtiğimiz gibi, XML belgelerindeki elemanlarıda CSS kuralları kullanarak biçimlendiredirebiliriz.
Örneğin <isim> Selim Akyokuş </isim> elemanını kalın, 16pt ve Times font’unda biçimlendirmek için aşağıdaki CSS kuralını kullanabiliriz.
|
XML belgelerini CSS kurallarını içeren CSS biçim dosyasına ilişkilendirmek için xml-stylesheet işlem komutu kullanılır. Örneğin aşağıdaki işlem komutu Şekil 4’te verilen adressbook.xml XML belgesini adressbook.css CSS kural dosyası ile ilişkilendirmektedir.
|
Bu işlem komutunun adresbook.xml belgesini adressbook.css teki kurallara göre biçimlendirilmesi için belgenin başlangıcına konulması gerekmektedir. Şekil 4’de verilen adressbook.xml belgesini biçimlendirmek için oluşturulan adressbook.css CSS biçim dosyası aşağıda Şekil 6’de verilmiştir.
|
|
Şekil 4’teki XML belgesinin adressbook.css dosyasındaki kurallara göre Internet Explorer 5.0’daki görüntüsü Şekil 7’de verilmiştir.
CSS basit biçimlendirme işlemleri için iyi bir yöntemdir. Karmaşık biçimlendirme işlemleri için XSL dili tercih edilir.
|
XSL (eXtensible Style Language)
XSL, XML belgelerinin biçimlendirilmesi tasarlanmış bir biçimleme dilidir. CSS’den çok daha güçlü bir yapıya sahip olmasına rağmen XSL yeni bir teknoloji olduğundan çok fazla yaygın değildir ve konudaki standardlaştırma çalışmaları henüz tamamlanamamıştır. XSL dili W3C’nin aşağıdaki spesifikayonlarını kullanır:
- XSLT – http://www.w3.org/TR/xslt
- Xpath – http://www.w3.org/TR/xpath
- XSLF – http://www.w3.org/TR/xsl
XSLT (XSLT Trasformations), XML belgelerinin bir dönüşümü için kullanılır. XSLT bir yapıdaki XML belgesini, XSL biçim dosyasındaki tanımlamalara göre başka bir yapıya dönüştür. XSLT, XML belgesini HTML diline, diğer bir XML belgesine veya XSLF formatlama nesnelerine dönüştürebilir. Bugün XSLT en yaygın olarak XML belgelerinin HTML belgelerine dönüşümünde kullanılır. Dönüşüm sonuçunda elde edilen HTML belgesi tarayıcılar ile görsel olarak gösterilebilir.
XSLT, bir XML belgesinin dönüşümü için ilk önce belgeyi parse ederek bir ağaç yapısı oluşturur. Oluşan ağaç yapısın kök elemanından başlıyarak ağaçı tarar ve XSL biçimleme dosyasında tanımlanan kalıplara göre dönüşüm işlemini gerçekleştirir. XSLT ağaç yapısını tararken Xpath ifadelerini kullarak ağaçın değişik kesimlerine erişir.
Xpath spesifikasyonu oluşan bir XML ağaçının içindeki düğümleri adreslemek için kullanılır ve ağaçın belirli kısımlarını adresleyerek ağaç içinde dolaşmamızı sağlar.
XSLT bir XML belgesini başka bir XML belgesinede dönüştürebilir. Örneğin cep telefonlarındaki WAP uygulamalarında kullanılan WML (Wireless Markup Language) cep telefonlarındaki kısıtlamalar düşünürüklerek XML dilinde tanımlanmış bir işaretleme dilidir. XML belgeleri XSLT kullanarak WML’e dönüştürülerek cep telefonlarında görüntülenmesi sağlanabilir.
XSLF (XSL Formating), XSL teknolojisinin biçimleme kısmını içerir. XSLT , XML belgelerini XSLF biçimlendirme nesnelerine dönüştür. Biçimleme nesneleri belgelerin görsel olarak sunumu sağlar. Biçimleme nesnelerinin görüntülenmesi için tarayıcıların XSLF biçimleme yapısını desteklemesi gerekir. XSLF spesifikasyonu henüz geliştirme aşamasında olduğundan bu yapıyı destekleyen bir tarayıcı yoktur.
XML’den HTML’e dönüşüm
Şu anda XML belgelerinin görüntülenmesi için en yaygın yöntem XML belgesinin HTML biçimleme diline dönüştütlmesidir. Dönüştürme işlemi XSL biçimleme sayfaları (style sheets) içinde tanımlamış dönüşüm kuralları ile gerçekleştirilir. Bu kurallar şablon (template) olarak adlandırılır. Şablonlar XML belgesi içindeki eleman ve özellikleri kalıplar (pattern) ile karşılaştırarak eşleştirilir. Kalıplar Xpath spesifikasyonuna göre XML belgesinin istediğimiz kısımlarına erişmemizi sağlar. Örneğin “/” kök kalıbı bütün belgeyi adresler. “isim” kalıbı XML belgesi içinde geçen bütün isim elemanlarını ifade eder. “adressbook/contact” kalıbı adressbook elemanı altındaki contact elemanını adresler. Eşleştirilen kalıplara şablonlar uygulanarak dönüştürme işlemi gerçekleşir. Örneğin aşağıdaki XML elemanına bakalım:
|
İsim elemanını aşağıdaki HTML ifadesine dönüştürmek isteyelim.
|
Bu dönüştürme işlemi için aşağıdaki XSLT şablonunu kullabiliriz.
|
Bu ifade bir XML belgesi içinde geçen isim elemanlarını bularak elemanın içindeki değeri <xsl:value-of/> ifadesi ile alır ve H2 etiketi içerisinde yazar.
Aşağıda sık olarak kullanılan XSLT diğer bazı şablon yapıları verilmiştir:
- Xsl:if
- Xsl:apply-templates
- Xsl:for-each
Xsl:if ifadesi şartlı eşleme işlemleri gerçekleştirilir. Örneğin aşağıdali ifade fiyat özelliği (attribute) 1000 olan ürünler için urun sablonunu uygulayacaktır.
|
Xsl:apply-templates XSL biçim sayfası içinde tanımlanmış şablonları uygulamamızı sağlar.
Xsl:for-each ifadesi bir XML belgesi içindeki elemanlara bir döngü içerisinde erişmemizi sağlar. Örneğin aşağıdaki ifade vehicles elemanı içindeki vehicle elemanlarına price elemanına göre sıralayarak erişmemizi sağlar.
|
Şekil 4’te verilen adressbook.xml belgesini Internet Explorer 5.0’da Şekil 8’deki gibi görüntülenmesini sağlayan bir XSL biçimleme sayfası Şekil 9’de gösterilmiştir.
|
Adressbook.xsl biçimleme sayfasına göre adressbook.xml belgesini biçimlendirmek için aşağıdaki işlem komutunun XML belgesinin başlagıçına konulması gerekir. Internet Explorer 5.0 bu komutu kullanarak belge ile biçimleme sayfasını eşleştirir ve XML belgesinin HTML formatına dönüşümünü sağlar.
|
XML belgelerinin XSL biçimleme sayfaları ile HTML’e dönüşüm işlemi isternirse Javascript kullanılarakta yapılabilir. Dönüştürme işlemi XMLDOM COM nesnesi ile yapılır. Şekil 10’da Addressbook.xml belgesini Addressbook.xsl biçimleme sayfasını kullarak HTML’e dönşümünü sağlayan Javascript kodu verilmiştir.
XML belgelerinin HTML’e dönüştürme işlemi isternirse Web sunucusu makinasınada yapılabilir. Bu yapıda sunucu tarafında XML belgeleri HTML’e dönüştürülerek tarayıcılara gönrilir. Böylece XSL’i desteklemeyen tarayıcılardada XML belgelerinin görüntülenmesi sağlanır. Şekil 11’da Addressbook.xml belgesini Addressbook.xsl biçimleme sayfasını kullarak HTML’e Web sunucusunda dönüşümünü sağlayan ASP kodu verilmiştir.
|
|
X. XML BELGELERİNİN İŞLENMESİ
XML belgelerinin uygulama yazılımları işlenmesi için bir çok yazılım paketi geliştirilmiştir. Bu yazılımlar XML processor veya XML parser olarak adlandırılmaktadır. Değişik firmalarca geliştirilen XML parser yazılımlarından bazıları şunlardır:
- Sun X package
- IBM XML4J package
- Oracle XML package
- Microsoft MSXML parser
- Open/XML parser
- Lark/Larval XML parser
XML parser’ları veya işlemcileri üç değişik model üzerine inşa edilmiştir. Bunlar şunlardır:
- Bildiri-tabanlı İşlem modeli (Declaretive processing model)
- Olay-tabanlı İşlem Modeli (Event-Based Processing model)
- Ağaç-tabanlı İşlem Modeli (Tree-based processing model
Bildiri-tabanlı işlem modelinde hangi işlemlerin gerçekleştirileçeğini belirtiriz. İşlemin nasıl gerçekleştileceğini sistem belirler. Örneğin ilişkisel veritabanlarında kullanılan SQL sorgulamama dili bildiri-tabanlı işlem modeline dayanan bir dildir. Bir SQL sorgu ifadesi hangi sonuçların elde edileceğini tanımlanır. İşlemin nasıl gerçekleşeceğini belirtilmez. XML için geliştirilen XQL gibi sorgulama dilleri ve XSLT bildiri-tabanlı işlem modeline dayanır. Bir önceki bölümde gördümüz XSLT dönüşüm örneklerinde dönüşüm işlemi XSL biçimleme dosyasında tanımlanmış olan kurallara gerçekleştirilir. Bu kuralların nasıl geçekleşeğini XML işlemcisi belirler. XSLT bildiri-tabanlı işlem modelinde oluşturulmuş bir yapıdır.
Olay-tabanlı işlem modelinde XML parser’ı XML belgesini okur iken bulmuş olduğu nesneleri uygulama programına olay (event) olarak bildirir. Örneğin bir başlangıç etiketi, karaketer veri veya bitiş etiketi okuduğunda bunu bir olay olarak uygulama programına iletir. Örneğin aşağıdaki XML belgesinin okunduğunu varsayalım:
|
XML parser’ı okuma işlemi esnasında aşağıdaki olayları türetir.
|
Uygulama programı XML parser’nın bildirdiği olay tiplerine göre XML belgesini işler ve uygulama amaçına göre bir çıktı üretir. Bu amaçla geliştirilmiş olan yaygın yazılım standardı SAX (Simple API for XML) arayüzüdür. SAX arayüzü basit uygulamalar için geliştirilmiştir. SAX arayüzünü bir çok XML parser paketi desteklemektedir.
Ağaç-tabanlı işlem modelinde XML parser ilk önce XML belgesini okuyarak belge yapısına göre sistem belleğinde bir ağaç oluşturur. Uygulama progamı bu ağaç yapısı içinde dolaşarak gerekli işlemleri yapar. Ağaç-tabanlı işlem modeli için kullanılan model
DOM (Document Object Model) dir. DOM , XML ve HTML belgerinin işlemesi için W3C konsorsiyumu tarafından geliştirilmiştir. Hiyerarşik bir yapıda olan XML belgeleri DOM modelinde bir ağaç yapısında temsil edilir. Örneğin aşağıda bir yazarlar XML belgesi verilmiştir:
|
Bu belge aşağıdaki ağaç yapısında temsil edilir.
DOM (Document Object Model) API
Ağaç-tabanlı işlem modeli için gelişirilmiş olan arayüz DOM (Document Object Model) API (Application Programming Interface) olarak adladırılır. DOM API dil ve platformdan bağımsız W3C’nin önerdiği bir arayüz spesifikasyonudur. Geliştirilen XML parser’larının büyük çoğunluğu bu arayüz spesifikasyonuna göre inşa edilmiştir. Bu kısımda Microsoft MSXML parser kullarak bazı örnekler vereceğiz. MSXML parser bir COM nesnesi olarak yazıldığından hem istemci tarayıcı tarafında hemde sunucu makinalarda çalışabilmektedir.
Ağaç yapısındaki XML belgelerini işlemek için DOM API bir çok nesne, yöntem ve özellik içerir. Aşağıda DOM’da kullanılan önemli nesneler listelenmiştir.
Nesne
|
Tanım
|
Document Element Attribute veya Attr Node NodeList Text Comment ProcessingInstruction
|
XML belgesinin kök nesnesi XML Elemanı XML özelliği XML ağaçındaki bir düğüm Düğümler Kümesi Bir eleman veya özellik içindeki metin XML açıklaması XML işlem komutu |
MSXML parser’nın Document nesnesinin önemli olan özellik ve method’ları aşağıda verilmiştir.
Özellik/Method |
Tanım |
Doctype DocumentElement ChildNodes FirstChild LastChild Text Async ValidateOnParse Load() LoadXML() GetElementsByTagName() |
Document DTD Kök eleman Alt düğüm listesi İlk düğüm Son Düğüm Belgede geçen tüm metinler False ise belge tamamen yüklediğin de cağıran method’a kontrolu devr eder. True ise yükleme esnasında devr eder. Beglenin DTD göre doğrulanması Bir XML belgesinin URL’le belirtiği dosyadan yükler XML belgesini direct metinden yükler Belirli bir tipteki elemanlar kümesini getirir |
Aşağıda MSXML parser’nın Node nesnesinin önemli olan özellik ve methodları verilmiştir.
Özellik/Method |
Tanım |
ChildNodes FirstChild LastChild ParentNode previousSibling nextSibling NodeName NodeValue TransformNode() |
Alt düğüm listesi İlk düğüm Son düğüm Üst seviye düğüm Aynı seviye önceki düğüm Aynı seviye sonraki düğüm Düğüm ismi Düğüm değeri Belirtilen XSL dosyasına göre dönüşüm yapar |
Aşağıda MSXML parser’nın NodeList nesnesinin önemli olan methodları verilmiştir.
Method |
Tanım |
item() nextNode() reset()
|
Düğüm listesinden istenilen düğümü getirir. Düğüm listesinden istenilen bir sonraki düğümü getirir. Liste imini başa döndürür.
|
Şekil 12’de bu kısımdaki MSXML parser örneklerinde kullanağımız movies.xml belgesi verilmiştir. Movies.xml dosyası bir film hakındaki film tipini, adını, yazarlarını, aktör gibi bilgileri içerir. Şekil 13 ve Şekil 15’te Internet Explorer 5.0 ile çalışan MSXML parser örneklerinin kodu listelenmiştir. Bu örneklerde Javascript kullanılmıştır.
Şekil 13’teki XML parser uygulaması Şekil 14’te görülen film adı ve açıklamalarını listeler. Bu uygulamada LoadDoc() fonksiyonu XML belgesini yükleyerek belgeyi ağaç yapısında bellekte oluşturur. Bu örnekteki aşağıdaki satır bir COM nesnesi olan MSXML parser’nı çağırır.
|
Aşağıdaki satır Movies.xml dosyasını yükler ve XML ağaçını oluşturur.
|
Aşağıdaki satır belgenin kök elemanına erişir.
|
Aşağıdaki ifade kök elemanın altında bulunan elemanların adeti kadar bir döngü oluşturur. Bu döngü içinde alt elemanlara erişiriz.
|
Aşağıdaki kod kök elemanın (movies) altındaki movie elemanının ilk elemanının (title) içeriğini getirir. ChildNodes.Item(i) alt düğümlerdeki her hangi bir eleman indeks’le ulaşmamızı sağlar.
|
Aşağıdaki kod kök elemanın (movies) altındaki movie elemanının son elemanının (comments) içeriğini getirir.
|
Şekil 15’te görülen XML parser uygulaması movies.xml dosyasında bulunan filimlerdeki aktorleri listeler. Programın üretiği çıktı Şekil 16’da listelenmiştir. Bu programdaki aşağıda verilen kod belge içinde geçen bütün actor elemanların bir listesini oluşturur. Oluşan aktörler listesindeki elemanlar bir döngü içerisinde taranarak aktör isimleri actors(i).text ifadesi ile listelenir.
|
XI. SONUÇ
Önümündeki aylar ve yıllar XML ve XML’in bir çok alandaki uygulamaları hakkında yapılan daha çok araştırma, geliştirme, yazılım ve yayın çalışmalarına sahne olacak. Şu anda olduğu gibi XML hakında daha çok işteceğiz. Bir çok araştırmacı ve yazılım geliştiricisi XML’in yazılım endüstirisinde radikal değişiklilere sebeb olacağına inanmakta ve XML’i elektronik veri değişiminin yeni ASCII standardı olarak kabül etmektedir. Microsoft, IBM, Sun ve Oracle gibi birçok teknoloji lideri firma XML ve XML uygulamala standardlarını desteklemekte ve XML tabanlı yeni ürünlerini bilgi teknolojisi uygulamalarının kullanımına sunmaktadır.
Bu yazıdada gördümüz gibi XML dili, XML söz dizimi kuralları, XML DTD, XML Schema, XML Namespaces, Xpath, Xpointer, XSL, XSLT, XSLF, SAX ve DOM gibi bir çok belirtim ve teknolojinin birleşiminden oluşmaktadır. Bu yazıda yalnızca temel XML teknolojilerini tanıtmaya çalıştık.
Bunların yanında XML’in veri tabanı sistemlerinde kullanımı; bir çok alandaki bilgi paylaşımını kolaylaştıracak XML sözlükleri (vocabularies); bu sözlüklerin standard bir şekilde tasarlanması, kayıt ve saklanması için Microsoft firmasının desteklediği BizTalk Framework’u; XML-RPC ve SOAP gibi XML mesaj protokolleri; elektronik ticaret alanında kullanılacak olan birlemiş milletler destekli ebXML çalışmaları; elektronik veri değişimi standardı XML/EDI gibi daha bir çok XML ile ilgili konu vardır. Bu konularda bilgi almak isteyenler aşağıda verdiğimiz kaynaklardan ve internetteki diğer kaynaklardan yaralanabilirler. Bu kaynaklardan özellikle http://www.oasis-open.org/cover/ sitesindeki XML cover pages XML konusunda geniş bir yayın listesi içermektedir.
KAYNAKLAR:
1. A Brief History of the Development of SGML, http://www.sgmlsource.com/history/sgmlhist.htm
2. Mark Johnson, XML for the absolute beginner, http://www.javaworld.com/javaworld/jw-04-1999/jw-04-xml.html
3. Ralf I. Pfeiffer, Tutorial 1: Overview of XML, http://www4.ibm.com/software/developer/education/tutorial-prog/overview.html
4. Micheal Morrison et al.,XML Unleashed, Sams Publishing, 1999.
5. Richard Anderson et al., Professional XML, Wrox Press Ltd., 2000.
6. Portable Data/Portable Code: XML & Java Technologies, http://java.sun.com/xml/ncfocus.html
7. Alex Homer et al, Active Server Pages 3.0, Wrox Press Ltd., 2000.
8. Danny Ayers et al, Professinal Java Server Programming, Wrox Press Ltd., 2000.
9. http://www.ibm.com/developer/xml/
10. http://msdn.microsoft.com/xml/default.asp
11. http://www.oracle.com/xml/
12. http://www.oasis-open.org/cover/
13. http://www.xml.org/
14. http://www.xml101.com
15. http://www.sun.com/software/xml/
16. http://ebxml.org
17. http://www.w3.org/XML/
18. http://www.xml.com/
19. http://www.xml.org/
20. http://www.xmlinfo.com/
21. http://www.geocities.com/SiliconValley/Peaks/5957/xml.html
Doç. Dr. Selim Akyokuş
Bilgisayar Mühendisliği Bölümü
Doğuş Üniversitesi
sakyokus@dogus.edu.tr