Page 9 - FUD20

Basic HTML Version

A
Z
U
RALOTÉKA DIGITÁLIS ADATBÁZIS
9
lag üres és csak az adatbankkal együtt használható, az Uralotéka elnevezés
magában foglalja az adatbázist is. Az UEDb adatbank Budapest és Koblenz
közös munkájának az eredménye. Az Uralotéka programcsomag koblenzi
termék, és a DFG-támogatás révén a DFG jogkörébe tartozik. Ez azt jelenti,
hogy a német tudományos kutatás rendelkezésére kell, hogy álljon (azaz nem
lehet magán-copyright).
7. A konverzió eredményének ellenőrzése
Az RTF/XML-konverzió megkövetelte az eredmény ellenőrzését, de az
anyagot csak akkor tudtuk rendszeresen leellenőrizni, amikor kész lett az új
betűkészlet. Az ellenőrzést célszerű volt úgy végezni, hogy egyidejűleg az
adatfelvétel (és a feldolgozás korábbi fázisai) során elkövetett tökéletlensége-
ket is kijavítsuk.
A konverzió során azokat a sorokat, amelyekben a konverzió szempontjá-
ból volt valami tisztázatlanság (például hiányzott a nyitó zárójel után a záró-
jel záró része) egyszerűen kihagytuk (átugrottuk, németül: „kikommentál-
tuk”). A legtöbb esetben ez betűket érintett, de néha nagyobb egységeket is.
Így kb. 800 sor megcsonkult. Ezeket a sorokat egyenként vissza kellett vezet-
ni az eredeti helyükre.
A téves kódolások sorozatos hibákat okoztak. Ezeket rendszerint a téve-
dés felismerése után a kódolás szintjén egy egyszerű „change all”-paranccsal
lehetett kijavítani.
Az UEDb-anyagának gépi kezelése lehetővé tette az UEW kódolási egye-
netlenségeinek felismerését és eliminálását. Így például egységesítettük a rö-
vidítéseket, beleértve a forrásokra és az irodalomra való hivatkozást is.
Budapesten Csúcs Sándor vette kezébe a korrektúra lebonyolítását. Egy
OTKA projekt keretében Molnár Zoltán hasonlította össze az UEW betáplált
szövegét cikkről cikkre az UEDb oldalaival. A munka lassan haladt, különö-
sen amikor Molnár egy új állást kapott és kikerült a Nyelvtudományi Intézet-
ből. Ezután Csúcs hallgatója, Tánczos Orsolya folytatta a munkát, amit sike-
rült még 2010 nyarán, a piliscsabai Finnugor Kongresszus előtt lezárni (Bá-
tori 2011).
8. Az UEW és az UEDb egyenértékűsége
A nyomtatott szótár és az (elektronikusan tárolt) adatbázis különbözősége
nyilvánvaló. Összehasonlításukat kommunikációs szerepük teszi lehetővé.
Az összehasonlítás történhet a tárolás és a teljesítmény síkján. Nem merülhet
fel kétség, hogy az adatbázis és a szótár ugyanazokat az információkat tartal-