), és mindezt a teljes szövegben legalább százszor. De a webmesterségről szóló írásban említek más bosszúságokat is. Ezért hát sok hálószövögető társammal együtt úgy döntöttem, hogy minden HTML-fájlomat magam írom, azaz minden egyes kapcsolót én teszek bele vagy hagyok ki belőle. A szövegfelismerőből kikerülő nyers RTF-anyagokba már a javítgatás során kézzel beillesztem a HTML-kapcsolókat, természetesen előregyártott Word-beli makrókkal. Nálam makróval ugrik be a szövegbe a háromféle kiemelés, a betűszín, a bekezdésigazítás, a képbeszúrás, a kéthasábosságot lehetővé tevő TABLE parancs, és még néhány egyedi objektum, pl. sakktábla vagy gyökjel, és maga a HTML-dokumentumok kötelező fejléce is.A honlap* bővítésének technikája
Itt vannak a fényképezéses digitalizálásra vonatkozó részletek.Remélem, sikerül valakinek némi újat is mondanom. Ha valahol súlyos hiba vagy hiányosság van az általam leírtakban, az olvasó a nemo44@hotmail.com címen hagyhat üzenetet.
A szkennelés
Mivel nem vagyok szakképzett szoftveres, csak a magam eljárását írom le, ami azonban fő vonalaiban általánosnak tekinthető. A szkenner (magyarul: lapbeolvasó) olyan készülék, amely nyomtatott szöveget vagy képet, fotót, diát, negatívot, esetleg más lapos tárgyat elektronikus képpé alakít. Két elterjedt típusa van: a síkágyas (flatbed) és a behúzós. Az utóbbi egy nyomtatóhoz hasonlít, és egész könyvet nemigen lehet beletömni. Nekem jelenleg az előbbi fajtából egy 19200-as Hewlett-Packard modellem van (2005-ben 24.000 Ft), miután a harmincötezres Epson szkennerem négy évi odaadó működés után egyre szélesebb és fehérebb csíkokat húzott a képekre, így lefokozódott szövegbeolvasóvá. Régebben pedig egy Mustek Scanmagic 1200-assal büszkélkedhettem, amit 1999-ben 16.000 Ft-ért vágtak utánam. Az 1200-as és a 19200-as szám a hüvelykenként beolvasható képpontok számát jelenti (dot per inch, dpi) a legérzékenyebb felbontásban, az utóbbi azonban már az elektronikus pont-interpoláció segítségével feltornászott érték.
Mindenkinek meg kell fontolnia, milyen célból vesz szkennert. Szöveghez általában elég a 2300 dpi is, a 9600-at arra használják (tudtommal), hogy nagyítatlan fotóanyagot (negatív filmet) vigyenek be. Színes fényképnagyítás szkenneléséhez célszerű finomabb felbontást (>300) választani. Az egy lap beolvasására szükséges idő nagyban függ a választott felbontástól és a processzor frekvenciájától. Ha egy perc alatt végigmegy egy A4-es lap, az házi használatra jónak tekinthető.
Szkennelési üzemmódok
Én három ilyet ismerek: a színes (color), a szürke (grayscale) és a fekete-fehér (lineart) funkciót. Az elsőt a színes fotókhoz, a másodikat a fekete-fehér ábrákhoz, a harmadikat pedig jellegzetesen a nyomtatott szövegekhez célszerű használni. Képek szkennelésekor (ha előzőleg beállítottuk) a nyerskép egy szerkesztőprogramba kerül, ahol azt forgatni, világosítani, körbevágni, kontrasztosítani stb. lehet. Ezután lemezre kell menteni és itt jönnek a bajok.
Természetesen a legjobb felbontást a bitmap (bmp) típus adja, amely minden képpontot megőriz ez azonban igen lassan töltődik le és irdatlan helyet foglal a lemezen. Az általam mélyebben ismert másik képtípus a jpg-formátum. Ez a bitmap-képet akár a huszadára is képes összenyomni, természetesen a felbontás és a színmélység rovására. Kb. úgy működik, hogy a képszerkesztő program olyan téglalapokra osztja a képmezőt, amelyek nagyjából hasonló színűek, és ezeken belül meghatároz egy-egy alapszínt, és a többi színt ennek valamiféle árnyalatává kódolja. Így nincs szükség arra, hogy pl. egy kék-zöld fényképen a piros szín intenzitásának megfelelő biteket nyitva tartsa, és persze üresen hagyja. Az erősebb tömörítés nagyobb téglalapokat és durvább színskálát eredményez, míg végül az arcok is eltorzulnak, az égbolt árnyalatai lágy egybemosódás helyett térben éles határral elkülönülnek, és a kép élvezhetetlenné válik.
Némelyik szoftveren a szkennelés előtt kinyíló ablakban nem állítható a megvilágítás erőssége, s ekkor a képeket a szkenner túl sötétre vagy túl világosra készítheti el. Ennek korrigálásakor a kép "fátyolossá" válhat. Jobb programokkal azonban külön állítható a megvilágított és a sötét részek kihangsúlyozottsága, továbbá egy "gamma" nevű kontraszt-paraméter. Hogy az elkészült, beszkennelt képpel ki mit csinál, annak taglalása igen messzire vezetne, ezért már csak egy érdekességet említenék.
A ragasztás
Ha egymás melletti témákról több képet készítettünk, és szeretnénk őket összeforrasztani, akkor több probléma merülhet fel. Az egyik az, hogy a két kép átlagos megvilágítottsága gyakran különbözik, így a papírképet előállító nagyítógép (automata vacak) az égboltnak ugyanazt a részét két különböző fényképen biztosan más tónusúra fogja kihozni. Összeragasztáskor itt igen rikítóan "ugrik" a szín. Ezen némiképp segíthetünk, ha a képszerkesztő programban a két képet egy-egy szerkesztőablakba téve fényesség és tónus szerint egymáshoz igazítjuk. Ezután az egyik képet vágólapra másolva rátehetjük a másikra. A digitális fényképezőhöz kapható ragasztóprogram egymásba mossa az illeszkedő képszéleket, ahogy éppen bírja. Csodára itt se számítson senki.
A másik probléma az, hogy a végtelenbe nyúló párhuzamos vonalak a fényképen jól láthatóan összetartanak, vízszintesen és függőlegesen is. Ha tehát két fényképre exponálunk egy vonatot, akkor előfordulhat, hogy még elektronikus összeragasztáskor sem találkoznak össze a vonalak. Ezen elvileg úgy lehet segíteni, hogy mindkét képet úgy vágjuk körbe (elektronikusan), hogy belőlük ugyanolyan széles csíkokat hagyjunk el. Sajnos ha az összeillesztendő képek egyike álló, a másik fekvő helyzetű, akkor ez sem segít: a vonalak korrigálhatatlanul szanaszét meredeznek. Ezért ajánlatos elkerülni a fényképezőgép ide-oda forgatását, mikor nagy témát több képre "szétexponálunk."
Filmszkennelés
Amikor a kisirtási honlap rám eső részét készítettem, több olyan tíz-húsz éves filmtekercs került a kezembe, amelyhez nem tartozott papírkép. Ilyenkor szét kell vágni a filmet, s nemcsak azért, mert a szkenner fedőlapján lévő sínnek csak bejárata van, kijárata nincs. A filmet a fedél felől egy álló fényforrás világítja meg, s az érzékelőpálca lassan elvánszorog alatta. Ennek kezdetén a szkenner minden valószínűség szerint viszonyítási színt vételez a saját fényéből, hogy a kapott (negatív esetén sárgás) színeket eköré rendezze. Az ám, de minden egyes leolvasóegység saját magának vesz mintát, s ha a negatívnak nincs egyszínű vége (exponálatlan csík a képkockák közt, illetve a film vágásvonala), hanem például egymásba lóg két kocka, akkor az innen vett minta helyileg egyenetlen lesz. Ez rusnya hosszanti színcsíkokkal okádja le a fényképet, és korrigálni szoftverrel sem lehet. Más gyógyírt nem is találtam rá, csak a film szétvágását 24 kockánként.
Könyvek szkennelése
Természetesen a legmagasabbrendű élvezet az, amikor szöveget gépelés helyett szkennerrel olvasunk be. A szerzői jogok minden olyan egyedi művet védenek, amelynek szerzője (fordítója) hetven évnél nem régebben halt meg bár kivételképpen engedélyt kaphatnak újabb könyvek is, pl. a Magyar Elektronikus Könyvtárban. A szerzői jogi törvény a lejárt oltalmi idejű könyveket papíron újranyomó vállalkozásoknak nem biztosít semmiféle jogot, és ezt igen jól teszi. Hogy mi a helyzet a CD-n árult, digitalizált régi művekkel, azt nem tudom. A rossznyelvek azt mondják, hogy az egyre hosszabbodó oltalmi időtartamok mögött főleg ma is népszerű amerikai rajzfilmfigurák jogtulajdonosainak érdekei állnak.
Vannak olyan szerzők, akik szándékosan lemondanak szerzői jogaik anyagi következményeiről, illetve olyan felhasználók, akik dzsungelharcot folytatnak a felhasználás korlátozása és a jogdíjak ellen. Az utóbbiak nyilván csak a törvényt szegik meg, de mozgalmukat a kiadóiparban állomásozó tőke le fogja törni. Az azonban szinte biztos, hogy a honlapomon gyülekező anyagok ügyében senki nem fog velem pereskedni, mert egyrészt igyekszem megtartani a törvényt (néhány engedély nélkül kitett rövidebb részlet kivételével), másrészt ebben a műfajban nincs akkora anyagi érdekeltség, amit jelentős mértékben sérteni tudnék. Ezen kívül a szerzői jog hasznos intézmény, mert a társadalom ezzel serkenti tagjait a szellemi alkotásokra, amelyek utóbb ingyenessé, közkinccsé válnak. Ugyan ki akarna nagyot alkotni, ha abból még életében sem tud megélni?
A könyv beszerzése
A könyvet legjobb örökre megvenni, mert így az elektronikus kiadásban esedékes javításokat is meg tudjuk ejteni. Másrészt a szkennelés során szétfeszülnek a lapok, a könyv darabokra is eshet, aminek a tulajdonos nem fog örülni. Persze a jó könyvek drágák, pl. a Sinay Miklós-féle egyháztörténet papírkötésben 3600 Ft volt, míg Herman Ottó halászati monográfiája árveréseken több tízezer forintért szokott elmenni. Célszerű legalább havonta végigjárni Budapest összes valamirevaló antikváriumát (van belőlük vagy ötven). Az útvonal megtervezésében sokat segít egy "Antikváriumok Budapesten" c. kiadvány, amit a Szőnyi Antikváriumában (V. Szt. István krt. 3.) adnak ingyen. A Bibliotéka Antikváriumban (VI. Andrássy út 2.) kapható jegyzék nem ilyen részletes (35 cím), de van egy nagy előnye: térkép található a hátoldalán. Némelyik cím elavult, pl. az Ulysses Antikvárium a Henszlmann utcába költözött, Tuza Antikvárium néven. [Az ezredfordulóig legalábbis osztogatták e listákat-térképeket; ma viszont a kenyérharc olyan erős, hogy nem szívesen árulják el a konkurencia telephelyét.] A legtöbb bolt mondanom sem kell a Nagykörúton belül található. Vidéken kevesebb antikvárium van, és pl. Krakkóban nagy meglepetésemre egyetlen igazi, klasszikus antikváriumot sem láttam.
A boltok között célszerű (csomagtartós) kerékpárral vagy motorral közlekedni, mert ez a leggyorsabb és a legkényelmesebb. A buszra, metróra várni kell, az embernek leszakad a keze, gyalog térdig kopik a lába, gépkocsival nem talál parkolóhelyet. Viszont aki biciklivel jár a városban, mindenképpen használjon egy erős kerékpárlakatot, mert különösen a Belvárosban, de a bevásárlóközpontok környékén is szerteszéjjel koslatnak némely hitvány emberszabásúak, és célszerszámmal fényes nappal elcsípik a gyengébb lakatokat, majd felülnek a más biciklijére. Az ilyeneket jól el kellene náspángolni.
A fenti eljárást nem válthatja ki teljesen, de alkalmanként kiegészítheti az internetes könyvrendelés. Csak rá kell repülni, teszem azt, az Online Antikvárium vagy az Antikva honlapjára, bejelentkezni, egy s más adatot megadni, és máris érkeznek a postahivatalba az utánvéttel terhelt könyvcsomagok. Pár ezer forint fölött a postaköltséget elengedik, illetve be is lehet gyalogolni hozzájuk a könyvért. Kínálatuk jónak mondható, árszabásuk nem alacsony, de még elviselhető.
A szövegfelismerés
Ez igazán fontos művelet, mert egy elrontott felismerés pokoli kínokat okozhat javítgatáskor. Fontos, hogy a szkenner fekete-fehér ("lineart") üzemmódban legyen. A fényességet többszöri próbálkozás után mindig az illető dokumentumhoz kell szabnunk. Hófehér lapon koromfekete betűk nem kívánnak világosítást, de a megsárgult (esetleg megbarnult) papíron sorakozó betűk csak úgy különülnek el úgy-ahogy a háttértől, ha előzőleg felcsavarjuk a fényerőt. Ismereteim szerint ekkor nem a szkenner fénycsövének intenzitása nő, hanem a "lineart" üzemmódban dolgozó kiértékelő-program fogja fehérnek "látni" a sárga (szkenneléskor szürkévé váló) lapot.
Ha a könyv e betűi felismerés után rendre c-nek látszanak, akkor túl fényes volt a szkennelés. Ha pedig a felismerés csigalassú, nagyon hibás, esetleg a gép a szöveg szélét sem találja meg biztosan, akkor bizonyára világosítani kell rajta. Figyeljünk a lap forgatottságára (orientation), mert ha külön nem szólunk neki, a gép a fejjel lefelé vagy oldalvást álló szöveget esetenként megkísérli úgy felismerni, ahogy áll. Az eredményt nem kell részletezni.
Szintén igen fontos, hogy a szövegfelismerőn beállítsuk a dokumentum nyelvét (akár előre elkészített képet dolgozunk fel utólag, akár közvetlenül a beolvasott képre eresztjük rá azonnal a felismerőt). Ellenkező esetben az összes ékezetes betű siralmasan elpusztul, pl. az ő betűk hatossá, az é betűk nagy C-vé válnak, és kezdhetjük elölről az egészet.
A nyelvi készletet (cserélhető csomagot) a telepítő CD-ről másolhatjuk be a szövegfelismerőbe és a megfelelő menü-műveletekkel aktiválhatjuk. Az egyes nyelvi készletek tartalmaznak valamiféle szótárt, illetve betűkapcsolati valószínűségeket. A felismerőprogram kétes esetekben ezek alapján dönti el, hogy valamely betűt c-nek vagy e-nek olvasson, vagy hogy a sorvégi kötőjeleket kigyomlálja-e. (Ez időnként visszafelé sül el, mint amikor a gép következetesen Dévaj Bíró Mátyást tesz a szemem elé, máskor a régies helyesírású mulva makacsul mint mulya jelenik meg, amint a helvét hitvallás sem leli a helyét.) Azokat a betűket, amelyeket még így sem ismert fel, a gép általában a ~ jellel helyettesíti. Több, mint valószínű, hogy a gót betűs szövegeket egyetlen program sem képes tisztességesen felismerni. A dőlt betűs szövegekkel is hadilábon állnak az OCR-programok.
A javítgatás
Ez mindig megkerülhetetlen, és mindig a legborzasztóbb szakasz. Ha valamely könyv lapjaira hosszas próbálkozással már kidolgoztuk az optimális felbontást, világosítást, és helyén van a forgatottság és a nyelv is, akkor a kezünkben van egy vagy több szerkeszthető dokumentum, pl. doc (Word dokumentum) vagy rtf (Rich Text formátum). Ezt először is olvashatóvá kell tennünk, ami a betűtípus, a méret, a sorköz, a margók és esetleg az igazítás átállítását igényli. Javítgatáshoz célszerű olyan betűtípust választani, amelyben az általában hasonló betűk jobban elkülönülnek (c e, egyes számjegy és l betű, nulla és O betű stb). Én a 16-os méretű, vastagított Courier New betűtípust használom, normális sortávolsággal. Ebben így néz ki egy átlagos hibagyakoriságú, frissen szkennelt szöveg:
"Mondjuk ki habozás nélkül, - Igy hangzik a Brunetiére
végszava, - hogy amikor a világ tömegesen tért vissza a természeti bölcselkedéshez ás, ügy látszott, semnú egyéb vágya mncs, mint hogy ismét pogánnyá legyen, és amikor az erkölcs meg.romlása a világot lef elé vitte a lejtőn, senki Kálvinnál többet nem tett arra, hogy visszatartsa a világot és megállítsa ezen a lejtőn...»'
A hálóra alkalmazás
Word dokumentumot sem internetre kitenni, sem levélhez csatolt állományként másnak elküldeni nem illik: terjedelmes, széteső, mindenhol máshogy jelenik meg, makróvírusok lehetnek benne. Másrészt a doc formátumú állományok olyan információt tárolnak, amelyből a gépünkre és akár az általunk már kitörölt szavakra is következtethet a hozzáértő.
Vannak, akik a Portable Document formátumra (pdf) esküsznek; ennek alkalmazása azonban öncélúvá válhat, ha sem a dokumentum szétmászásának veszélye, sem különleges betűformák, sem hitelesítési célok nem indokolják. Pdf-ből másolni sem olyan könnyű, mint egyéb formátumokból és némelyeknek éppen ez a céljuk vele. Ahogyan azoknak a hisztérikus paranoiában szenvedő egyéneknek is, akik a linkeket egy süket, döglött új ablakban nyittatják meg egy nevetséges szkripttel, letiltott jobb egérgombbal, nyomtathatatlanul. Kezdő tanár koromban így tett a www.felvi.hu nevű portál is a legfrissebb felvételi feladatsorokkal és javítókulcsaikkal az informatikában kevéssé boszorkányos pedagógusok átkaitól kísérve. (Vigasztalásul hozzáteszem: én sem vagyok egy webzseni, mégis sikerült kicseleznem a szkriptet.)
Szövegek megjelenítésére kényelmi szempontból legjobb a puszta szöveg (txt) vagy a Rich Text (rtf), de az internetre leginkább HTML-ben szoktak anyagokat felrakni. Igaz, a jelenleg uralkodó vírustípus, az ún. féreg itt is megél, de őellene még mindig le lehet tiltani a csicsákat a böngészőben. Aki ért valamilyen HTML-szerkesztőhöz, vagy egyszerűen megbízik a Word HTML-mentési funkciójában, annak itt nem is mondok többet. Éljen boldogul, és bizakodjon, hogy amit ő a saját képernyőjén lát, azt a vonal túlsó végén is ugyanúgy fogják látni. Létezik egy figyelemreméltó megközelítés, amely a vakokra és a gyenge ellátottságú felhasználókra való tekintettel igyekszik mellőzni a csicsás szkripteket és egyéb járulékokat, amelyek csak a felszínes vizuális benyomást gazdagítják, a tartalmat nem. Többé-kevésbé én is ennek a híve vagyok, amennyiben tudatosan mellőzöm a bizonytalanul megjeleníthető, böngészőtől függő elemeket, és a mindenki által elérhető látványmorzsákra szorítkozom.
Ez szükségszerűen maga után vonja azt a döntést, hogy a táblázatokat, speciális karaktereket, elválasztójeleket és hasonló nyomdai elemeket lehetőség szerint karakteres formában próbálom közölni. Természetesen a kódolások terén folyó lassú átrendeződés (ISO UTF8) és a felhasználó számítógépére telepített betűtípusok itt is okozhatnak galibákat. A szövegben található képleteket lehetőség szerint megpróbálom táblázatok segítségével reprodukálni; újabban (pl. Bolyai Appendixének és az erről szóló elemzéseknek digitalizálásakor) már azt is sikerült megoldanom, hogy a képlet vagy vektorjel mint táblázat ne okozzon sortörést, hanem beilleszkedjen a folyó szövegbe. Tudom, hogy a közszokás (még a TeX HTML átalakításkor is) a képpel való megjelenítést erőlteti ilyenkor, de ez bumfordi, fölöslegesen sok képfájlt igénylő és más programokkal esetleg el sem olvasható formátumot eredményez.
Jó, ha az ember legalább az alapfokú HTML-tag-eket (kapcsolókat) ismeri, pl. a vastag és dőlt betűt, a bekezdést, a betűméretet, a table funkciót és a képbeillesztést. A hálón található segédanyagok jórészt angolul íródtak, s a magyar ismertetőket egy éven belül áthelyezik, átnevezik vagy letörlik, ezért linket nem adok rájuk.
Puritán ízlésem és rendszeres gondolkodásom folytán azok közé tartozom, akiket nem tud boldoggá tenni egy összehányt, dülöngélő gépi HTML fájl, amiben a masina először kikapcsolja, majd újra bekapcsolja a betűtípust és -méretet (valahogy így: </font><font face="Times New Roman" size=4>
Amikor a hibák ki vannak gyomlálva, és a szöveg felöltötte véglegesnek szánt alakját, akkor sima txt-ként elmentem (ügyelve az ő, ű betűk különféle módosulataira, melyek időnként hajlamosak o, u-vá válni ilyenkor), majd egy fájlkezelővel egyszerűen átnevezem htm-mé, és végül a böngészővel megnyitom. Gyakran előfordul, hogy a szöveg utolsó harmada végig dőlt- vagy félkövér betűs ilyenkor meg kell keresni az elrontott kikapcsolót (</i>, </b>) vagy a számfeletti bekapcsolót (<i>, <b>). Ez azonban már felüdülés a javítgatás gyötrelmei után.
Itt azonban még nincs végük a megpróbáltatásoknak: biztosan benne maradt a szövegben oldalanként legalább egy hiba. Ezek többségét a helyesírás-ellenőrző le tudja fülelni, ha a kész HTML-fájlt valahogyan átalakítom puszta szöveggé (pl. a böngésző mentési parancsával). És kezdődhet a párhuzamos munka: az egyik ablakban nyitva van a HTML forrása, a másikban a nyelvi ellenőrzés alá vetett szövegfájl. Ez utóbbin a gép kalauzolja végig az embert, bosszantóan akadékoskodva, semmi hajlamot nem mutatva a tanulásra. Hiába táplálom bele pl. Melanchthon nevét; ha a következő sorban Melanchthonnal történik valami vagy Melanchthonhoz írnak levelet, az ész nélküli masina azonnal szól: nem ismeri ezt a szót. Ami "javítást" pedig a létező szavak helyett szokott ajánlani, abból egy önálló gyűjteményt állítottam össze.
Azt mondják, az ismételt átolvasások alkalmával a hibák száma exponenciálisan csökken, vagyis az eredeti mennyiségnek pl. negyede, tizenhatoda, hatvannegyede marad benne. Az olvasóközönség azonban nemigen szokta méltányolni a szöveg fölött görnyedő javítóbiztos munkáját, és már egy-két bennfelejtett hiba láttán felfortyan. Való igaz: egy vakító fehérségű új könyvet könnyű felismertetni, de az ódon példányok (pl. a Trianon utáni ínséges viszonyok közt nyomtatott magyar könyvek) megbarnult papírja, esetleg maitól elütő betűtípusa alaposan megizzasztja a digitalizálót. Kérek tehát mindenkit, hogy illő megbecsüléssel és megértéssel tegyen képernyőjére egy-egy régi művet, melyben bizonyosan több ember fáradságos munkája rejlik.
A hálón fenn van egy figyelemreméltó digitalizálási menetrend Láng Attilától; ez számomra elég körmönfontnak tűnik (a könyvek szétszedése és a javítgatás nagyfokú gépesítése miatt), de mások talán tanulnak belőle. Sajnos a legnagyobb ötlete, a könyvnek ábécésorrendbe rakott szójegyzékké alakítása és az ezen való egyszeri végigtekintés azzal járna, hogy a szövegkörnyezetet nem tudnám figyelembevenni, és bizonyos szavakat tévesen javítanék ki, vagy nem tudnám, mire javítsam őket, kivált a rövidebbeket.
* * *
Szövegbevitel fényképezőgéppel
Küszöbön áll az a boldog kor, amikor a tudósok a számukra értékes források nagy részét az internet útján fogják kezelni, jelképes tagdíjért vagy akár ingyen. A hálón még az egyházatyák legbővebb latin kiadása is fenn van, de sajnos csak zártkörű adatbázis formájában. Viszont a görög újszövetségi kéziratok fényképeitől kezdve a magyar próza ősnyomtatványaiig a legcsodásabb olvasnivalók már most is elérhetők vagy a közeljövőben válnak azzá. Ebben a Google digitalizálási projektje élen jár, de gyakorta elrejti magukat a műveket, és csak keresést engedélyez bennük. E szempontból felhasználóbarátabb aa Internet Archive vállalkozása. Én is kiszemeltem néhány alapművet (listájuk a lap alján található), hogy segítsek azoknak, akik nem akarnak napokat a könyvtárban tölteni, több kilós köteteket hazacipelni, illetve pár példányban meglévő műveket hajszolni (főleg a világ kevésbé szerencsés tájain). E vállalkozásom technikája nagyjából kiforrott már, ezért ideiktatom a legfontosabb megoldásokat az érdeklődő közönség épülésére. A szemléltetésre azt a művet használom, amelyre első ízben alkalmaztam a fényképezőgépet mint nagyléptékű beviteli eszközt.
A középkor egyházjogi gyűjteményének (Corpus Juris Canonici, 1582, röviden CIC) közzétételére már elindult egy kezdeményezés Los Angelesben, a Kaliforniai Egyetem digitális könyvtárában. A könyvet valószínűleg csak száz év múlva fogják HTML-be áttenni, amikor már idáig zúdulnak a Gutenberg-galaxist ma még csak nyaldosó digitalizálási hullámok. Addig be kell érnünk a képformájú elektronikus kiadással. Ahogy azonban e behemót képfájlokat elnézem, nem volt haszontalan, hogy velük párhuzamosan elvégeztem ugyanezen könyv későbbi kiadásának (Párizs, 1695) a képmásolását. Az igaz, hogy amabban megtalálhatók a nagy tekintélyű és még nagyobb terjedelmű hivatalos jegyzetek is (Glossa ordinaria), de cserébe az én elektronikus kiadásom egy CD-re ráfér, és sokkal könnyebben lehet benne lapozgatni.
Leszögezem, hogy ez a kiadás nem vitt végbe példátlan hőstettet, mert a törvények szövegét már a XIX. században kiadták a párizsinál is alaposabb szövegtanulmányok alapján. (Ebből Gratianus Dekrétuma szövegformában is olvasható.) Figyelmeztetek tehát mindenkit, hogy járjon utána a témának újabb művekből is, ha úgy dönt, hogy az itt megjelentetett anyag egy részét olyan tudományos publikációban kívánja felhasználni, amin a szakmai híre-neve múlik. Ha pedig valamelyik betű olvashatatlannak tűnik, keresse meg ugyanezt a helyet a(z) UCLA honlapján.
Egy házilagos összeállítás segítségével dolgoztam, amelyet később kis mértékben tökéletesítettem. Ez látható a két képen is, persze a fényképezőgépet leszámítva, mert az éppen a kezemben volt, s a képen látható darab egy illusztrációul szolgáló gyerekmasina. Semmi másra nem volt szükségem, csak egy 6 megapixeles digitális gépre, kisállványra, négy asztali lámpára (összesen 400 watt), egy fürdőszobai tükörre (mely a fényt is segít összeterelni), egy seprűnyélre, némi gatyagumira a finomhangoláshoz, és pár egyéb apróságra.
Nézzék el nekem a tisztelt olvasók, ha a(z) UCLA projektjéhez képest gyengébbet alkotok. Ez a próbálkozásom is azt szemlélteti, hogy Magyarország soha nem "erőből" boldogult, hanem olyan eszközökkel, amik éppen akadtak. A könyvfotózás profi eszközei (fordított háztető alakú üveglemez a lapok szétfeszítésére, sűrített levegővel működő lapozóberendezés, huszonegynéhány megapixeles fényképezőgép-pár) milliókba kerülnének. Ha valamelyik projektmenedzsernek eszébe jut, hogy túlszárnyalja munkámat, bizony nem fogok megsértődni.
Pár nap alatt elkészítettem az összes képet, aztán nekifogtam a feldolgozásuknak egy makrókat is kínáló Photoshoppal. A forrásfájlok mérete 33,5 MB, fizikailag kb. 3000×2000 képpontosak. (A[z] UCLA oldalai valamivel kisebbek, de azokon jóval kevesebb a betű is.) Ezekből próbáltam hálóra alkalmas, de még mindig tűrhetően olvasható lapokat varázsolni. A könnyebb áttekinthetőség kedvéért csak a 139. oldal egyik sarkát csatolom ide Gratianus Dekrétumából, mégpedig a feldolgozás sorra következő szakaszaiban.
JPG, 89k |
JPG, 88k |
JPG, 150k |
JPG, 148k |
JPG, 177k |
JPG, 197k |
Ezután a hátteret kell szemkímélőbbé tenni. A Photoshop a szürkeárnyalatos képekből pl. barna- vagy kékárnyalatosat tud készíteni a "Image / Mode / Duotone" állapotba való helyezéssel. Ezután a színek számát négyre csökkentettem (Image / Mode / RGB, majd Image / Mode / Indexed color, és ebben a színválasztás "Adaptive", azaz a kép színeloszlásához idomuló). A szerkesztés végállapota egy 47 kilobájtos GIF kép, illetve a teljes lapé 273 kB. Ez persze még mindig elég nagy, de csak azért, mert az olvashatóság kedvéért az 1700×2900 képpontos méretet nem csökkentettem. A két hasáb közül egy így is rá fog férni a legtöbb képernyőre. Ezeket a terjedelmes könyveket kivétel nélkül új honlapokra helyeztem, mert a Freeweben elvben 500 megabájtos korlát van érvényben. Más képközlésű honlapjaimon az egyhasábos könyvlapokat 1000 pixel szélességűre szoktam méretezni - talán ezzel nem zárok ki nagyon sok felhasználót.
A könyvben való eligazodást keretrendszer végzi: ennek egyik ablakában a tartalomjegyzék gördíthető föl-le, a többiben maguk a lapok forognak. A tartalomjegyzéket minden könyvhöz én magam állítom össze úgy, hogy az egyes lapokat mind elő lehessen hívni, de a keskenység érdekében rövidítéseket kell alkalmaznom benne. Így pl. a CIC-ben a [282F] TabExvg kódú sor arra utal, hogy az eredetileg nem számozott, de hattal a 282. után lévő oldalon található a XXII. János pápa Extravagantes című kánonjogi összeállításához tartozó ábécérendű címjegyzék első oldala. Úgy vélem, ezeket a honlapokat amúgy is olyan embertársaim fogják látogatni, akik valamicskét tudnak latinul, illetve érdeklik őket a régi szövegek; az ilyeneket pedig nem kell féltenem attól, hogy eltévednek a lapok között.
A valódi eligazodást azonban maga a papírkönyv teszi lehetővé a szerkesztők által kialakított beosztásával, a hozzá csatolt tömérdek mutatóval és lajstrommal. Igáslónak való munka lett volna mindezt szöveggé alakítani és HTML-utalásokkal telerakni, ezért hát karddal csaptam a csomóba, és felosztottam a képeket tartalmazó ablakot, valamint megdupláztam az oszlopszerű tartalomjegyzéket is, és a keresgélést rábíztam az olvasóra. A következő két kép bemutatja, hogyan kell elektronikusan megkeresni egy olyan szövegrészt, amelyet a papírkönyvet lapozgatva is meg lehetne találni.
Valamiért kedvünk támad megnézni a szerkesztők által a Liber Sextus elejére illesztett mutatót. Elkezdjük lapozgatni, és az általam [282F]-fel jelölt oldalra tévedünk. Fölfedezzük rajta a fent említett szakaszcímet: Quia quorumdam, és megállapítjuk, hogy a 388. oldalon van. A bal felső kisablakbeli linkkel a bal alsóba penderítjük az Extravagantes Joannis XXII. tartalomjegyzékét (ezt nem jelöli nyíl). Elgörgetjük a 388-as lapig. A 388-as szám előtti háromszöggel végre megjelenítjük a keresett oldalt a teljes szélességet fölvevő felső ablakban. Örömmel látjuk a jobb hasábon XXII. János szavait: "Mivel a hazugság atyja olyannyira elvakította némelyek elméjét..."
Még jobb tömörítést
tesz lehetővé a DJVU-nek (ejtsd: dezsávü-nek) nevezett képformátum. A DJVU-kódolás során a program a hátteret és a szöveget elválasztja, és rájuk más-más tömörítési eljárást alkalmaz. Ezt az új technikát többnyire fehér alapon fekete vonalábrák, szövegek képformájú tárolására és megjelenítéséra szokták alkalmazni, és a tárigénye kisebb a kétszínű, nagyon fárasztóan olvasható GIF-énél is. Magyarul a Könyvtári Figyelő című lapban megjelent tartalmas leírást tudom ajánlani, de különben elég a keresőbe beírni ezt a négy betűt. A megjelenítéshez és újabban a DJVU-vé való alakításhoz is találhatók már ingyenes szoftverek a hálón; én kissé körülményesen a JPG - PDF - TIFF - DJVU utat járom be, mert nincs módom megvenni a DjvuPro vagy a Document Express nevű mindentudó programot. A formátumot gondozó Lizardtech cég megérdemli, hogy a nevét ideírjam: tőle lehet letölteni az ingyenes olvasót és a böngészőbe beépülő léptető-nagyító menüsort e formátumhoz. Elvileg a DJVU-kön belül is lehet utalásokat és más navigációs elemeket elhelyezni, de én még csak lineárisan lapozható (illetve tömörítvényekben letölthető) állományokat helyeztem el a könyvfényképezéses honlapjaimon. Akinek megvan a fent említett plugin, meg is tekintheti, mennyire maradt olvasható a teljes 139. oldal két felbontásban: 180 dpi (109KB) és 300 dpi (52KB).
A tervezett folytatás (a könyvre kattintva előjön a bellap új ablakban):