Page 4 - FUD20

Basic HTML Version

B
ÁTORI
S. I
STVÁN
4
A táblázat is tulajdonképpen lista, amelyben a síkban rejlő mindkét di-
menzió követhető. A táblázatban vannak sorok és oszlopok, amelyek megha-
tározzák a cellákat. A táblázatban a soroknak és az oszlopoknak tulajdonít-
ható szemantika (érték) is, ahogy ez például a menetrendben szokásos: az el-
ső oszlopban áll a város neve, a következő oszlopokban az indulási/érkezési
idő. Az oszlopok felzete szükség esetén megnevezheti az oszlopok tartalmát.
Az adatbank (adatbázis) egy olyan táblázat, amelyben a cellák (mezők)
tartalma rendszeresen meg van határozva. Az adatbank – ellentétben a táblá-
zattal – alapvetően két részből áll: 1) a cellákba rendezett adatok, és 2) a cel-
lák/mezők leírása. Minden sor egy külön entitás, és az oszlopok az entitások
tulajdonságai. Az adatbank ugyan rendszerint elektronikus médiumokban
realizálódik, de elképzelhető papíron is.
2. Elektronikus tárolás, digitalizálás és szövegbetáplálás
Az elektronikus tárolás egy további új (nem térbeli) dimenzió, amely elvi-
leg kombinálható a felsorolt szövegváltozatokkal. Az elektronikus tárolás in-
herens módon két szinttel dolgozik: a tárolás szintjével és a megjelenítés
szintjével. Az elektronikus tárolással szemben a nyomtatott szöveg (lista,
táblázat) esetében ez a két szint összeesik. Ez azt jelenti, hogy az elektroni-
kus tárolásnál a belső (vagy háttérbeli) reprezentáció szükségszerűen nem
azonos a tárolt anyag képernyőn (vagy papíron!) való reprodukciójával. A
megjelenítés természetes célja viszont éppen a belső szint hű tükrözése.
A digitalizálás az elektronikus tárolás előkészítése. A tárolandó anyag
ugyanis nem mindig alkalmas közvetlenül az elektronikus tárolásra. Képeket
(zenét, filmet) is lehet elektronikus médiumon tárolni, de ehhez az szükséges,
hogy egy szkenner a kétdimenziós képet átalakítsa elektronikus impulzusok-
ká. Szorosabb értelemben ezt a folyamatot nevezik digitalizálásnak.
A szövegek digitalizálása a képek digitalizálásának egy különleges esete.
A digitalizált szöveg (lap) csak mint kép jeleníthető meg. A digitalizált szö-
vegeket vagy annotálni kell, vagy szükséges egy további szövegfelismerő
program, amely betűről betűre átalakítja a szöveget (ma általánosan) Unicode
jelek füzérévé. Ez a transzformáció radikálisan redukálja a tárolóigényt.
A szövegfelismerő program megbízhatósága függ először is a szöveg álla-
potától, amibe belejátszik a nyomdatechnika és a papír minősége is. Kritikus
pont a mellékjeles betűk helyes felismerése. A legegyszerűbb a mellékjelmentes
szövegek (például az angol) felismerése, nehezebb a magyar és még nehe-
zebb egy fonetikai transzliteráció felismerése. Tulajdonképpen minden nyelv
(helyesírási rendszer, nyomdai konvenció) külön szövegfelismerő programot