Page 7 - FUD20

Basic HTML Version

A
Z
U
RALOTÉKA DIGITÁLIS ADATBÁZIS
7
lenne optimális, ezért az RTF-ben kódolt UEW-anyag végül is az XML-
rendszerbe lett konvertálva (Puttkammer 2001; Németh 2002) – így született
meg az UEDb.
Az UEDb tehát az UEW-ból készült, XML-formátumú, szövegszerű,
elektronikusan tárolt adatbank.
A szövegszerűség azt jelenti, hogy az adatbankra jellemző mezők meg-
vannak, de nincs meghatározva a mezők nagysága. A továbbiakban úgy épül
fel és úgy működik, mint az adatbankok általában: a mezőknek van nevük,
amelynek segítségével elérhetők és feldolgozhatók az adatok. A mezők to-
vább tagolódhatnak almezőkre és fakultatívak (lehetnek üresek is). A mező-
nevekhez hozzá lehet fűzni „attribútumokat”. A mezők sorrendje a tárolás
szintjén kötött. A mezők attribútumainak a sorrendje ezzel szemben tetszőleges.
Megvan itt is az adatbank két fő összetevője: 1) a tárolt anyag: a szócik-
kekbe szedett etimológiák, amelyek tartalmilag azonosak az UEW anyagával
és 2) a mezők leírása/definiciója, amit az XML-rendszerben DTD-nek (Data
Type Description-nak) neveznek.
Az adatok a elektronikusan vannak tárolva. A tárolt adatok megjeleníté-
séhez szükség van megjelenítő szoftverre.
5. Az Unicode betűk
A megjelenítés első és kikerülhetetlen feltélete a megfelelő betűkészlet,
amelyet nem lehetett átvenni a Winword-rendszerből, hanem elő kellett állí-
tani. Perspektivikusan a szimbolikus betűjelölés tűnt a legcélszerűbbnek,
mert egyrészt így az UEDb betűit egy behelyettesítő listával bármikor meg
lehetett változtatni, ami átvezetett az (akkor Europában még) új Unicode-
rendszerű betűkódolásba, másrészt biztosította a fejlesztési munkafolyamat
számára szükséges flexibilitást (Németh 1999, Saliha Rabah 2002).
Az Unicode rendszerű kódolás abból indul ki, hogy a szócikkekben (és a
központi UEDB.XML-fájlban) a mellékjeles betűk, azaz azok a betűk, ame-
lyek az egyszerű billentyűzettel nem írhatók, szimbolikusan vannak jelölve,
például: a_acute (= á), c_caron (= č) és így tovább. Ezeket a szimbolikus ne-
veket egy konverter (FONTS.DTD) átfordítja hexadecimális Unicode-érté-
kekké, amelyeknek felszíni alakját az aktuálisan használt TTF-fájl betűzi ki.
(Részletesebben lásd angolul Bátori 2012.)
6. A megjelenítő szoftver
Az XML-konverzió sikeres lezárásával a fejlesztési súlypont megválto-
zott: Egyrészt a konvertált szócikkek és a mellékjeles betűk tényleges kibetű-