Előadások anyaga


  • dr. Kokas Károly: Sajtódigitalizálás: Hol tartunk? Merre megyünk? Diák [PPT] [MS PowerPoint]
  • dr. Virágos Márta: Sajtódigitalizálás a Debreceni Egyetem Egyetemi és Nemzeti Könyvtárában Diák [PPT] [MS PowerPoint]
  • Czupi Gyula: Sajtódigitalizálás a könyvtárban - Halis István Városi Könyvtár, Nagykanizsa Diák [PPT] [MS PowerPoint]
  • Tóth Báthori Erzsébet: Az újvidéki Magyar Szó digitalizálása Teljes szöveg [PDF] Diák [PPT] [MS PowerPoint]

Bemutatók

Egyéb letöltések

Beszámoló

A találkozó délelőttjén szervezőként örömmel láttuk, hogy jelentkező részvevők közül szinte mindenki eleget is tudott tenni a meghívásnak. Sőt, volt pár vendégünk is, akik jelentkezését nem fogadtuk időben (ez csak a vendégek részére összeállított információs csomagok előkészítésében okozott problémát). Ezektől a vendégektől ezúton és elnézést kérünk, reméljük ennek ellenére mindenkihez jutott a tájékoztató anyagokból.

Az érdemi munka – a megjelentek örvendetesen nagy száma mellett is – közelítőleg a tervezett időben meg is kezdődött. Fél tizenegy után pár perccel a Magyar Elektronikus Könyvtárért Egyesület nevében Moldován István rövid köszöntővel nyitotta meg a délelőtti szekciót. Bevezetőjében röviden ismertette a rendezvény főbb céljait, valamint nagy vonalakban beszámolt az Egyesület tevékenységéről.

A délelőtti előadások tematikáját tervezve igyekeztünk a rendezvény témakörét különböző rétegekben megközelíteni, az átfogó kérdésektől a konkrét kiadvány digitalizálását övező problémákig.

Kokas Károly előadásának több pontja lett a később lefolyt diskurzusok kiindulópontja, lévén – kérésünknek maximálisan eleget téve – igyekezett kitérni a sajtódigitalizálás összes problémásabb pontjára. Előadásának egyik legfőbb tanulságaként azt emelhetjük ki, hogy – a dokumentumtípus sajátosságaiból következőleg – a sajtódigitalizálás különös stratégia megfontolást és elkötelezettséget igényel az intézmények részéről. Ez az előadás az előremutató, professzionális megoldások mellett tört pálcát, tehát azt sugallta, hogy igyekezzünk csak olyan megoldásokba belemenni, melyek biztosan hosszabb távon hasznosítható, szélesebb körben bevethető eredményeket hoznak. Rámutatott, hogy az ehhez szükséges együttműködés keretei elméletben megvannak.

Következő előadónk, Czupi Gyula, egy regionális központ működő digitalizálási stratégiáját mutatta be. Előadásának főbb tanulsága a rendkívül ötletes és gyakorlatorientált megoldások bemutatása volt, melyek sok, főleg térségi és szakterületi illetőségű intézmény számára megfontolandók lehetnek.

Az utoljára elhangzott előadás a sajtódigitalizálási feladatok legalapvetőbb rétegével, a konkrét kiadvány feldolgozásával foglalkozott. Tóth Báthori Erzsébet beszámolójában a vajdasági Magyar Szó feldolgozása kapcsán megismerhettük nemcsak a digitalizálás körülményeit, hanem a kiadvány történetét és megjelenésének sajátosságait. Bár ezek külső szempontokként is felfoghatók, valójában a sajtótermékek digitalizálásánál tapasztalható, hogy mennyi történeti és eseti körülmény befolyásolhatja a munkát.

Az idő rövidségére tekintettel azt kértük a résztvevőktől, hogy előadókhoz intézett kérdéseket a program délutáni, kötetlenebb részében tegyék fel.

A délutáni szekció bemutatása előtt engedjenek meg pár, szolgálati jellegű megjegyzést, tőlem, a moderátortól. Ez a programrész eredetileg "kerekasztalként" lett meghirdetve. Hála a reméltnél sokkal nagyobb érdeklődésnek és a résztvevők örvendetesen nagy számának, ez csak jelképesen tudott megvalósulni. Azt is szerettem volna, ha minden résztvevő intézmény bemutatkozik, ettől végül sok esetben eltekintettünk, reméljük ezt kompenzálta a délután felvetett kérdések gazdagsága, és mindenki elegendő információval tért haza.

Mindezek után a délutáni rész ténylegesen úgy alakult, hogy feltett kérdések, felvetett vitapontok váltakoztak a résztvevők rövid bemutatóival. Igyekszem az alábbiakban ebből minél több érdekes momentumot kiragadni.

A szekció rögtön a Takáts Béla által felvetett kérdéssel indult: hogyan hathat ki a digitálisan létrehozott kiadványok növekvő száma a digitális archiválás ügyének elősegítésére? Tóth Báthori Erzsébet (Magyar Szó) szerint ennek egyik példája a náluk bevezetett lokális gyakorlat, mely a digitális úton készült kiadványok archiválását kötelezővé teszi. Kokas Károly (SZE) ugyanakkor rámutatott, hogy a DTP-publikálás gyakorlata jelenleg nem web-centrikus: a technikai szerkesztők a nyomdai felhasználás céljait tartják szem előtt, ennek számos formai következménye van, melyek miatt ezek a változatok nem publikálhatók az interneten (ilyen a technikai formátumok, karakterkód-lapok problémája). A problémát tovább mélyíti a kiadói ellenérdekeltség, amit jelenleg nem ellensúlyoz szabályzás a digitális változatokra nézve. Czupi Gyula kiadói oldalhól tett hozzáfűzést: a gyakorlatban nagyon nehezen követhető a korrektúra-változatok útja. Gyakran nem a megfelelő minőségű digitális változat kerül be a közgyűjteményi archívumba. Kokas Károly a szabályozási oldalról azt találná megfontolásra érdemesnek, ha a lap- ill. könyvkiadást (pl. tankönyvek) támogató pályázatok feltételei között szerepelne a megfelelő digitális változatok beadási kötelezettsége. Moldován István (MEK Egyesület) véleménye szerint a digitális köteles példány intézményének jogi szabályozására lenne szükség, befogadó rendszerek már léteznek, mint pl. a digitális sajtó szolgáltatásra létrehozott EPA. Németh Marcell (OSZK) mutatott rá, hogy a lapkiadók szívesebben adják a digitális változatokat piaci alapú rendszerekbe (mert nyilván rentábilisabb), mint pl. a Press Display. (http://www.pressdisplay.com/) Ez a helyzet pl. a kurrens magyar megyei napilapok nagy részénél. A moderátor megjegyzése: nemcsak a napilapoknál ez a helyzet, számos folyóiratunk digitális kiadói változatai találhatók meg nem-közgyűjteményi archívumokban, mint pl. a CEEOL vagy az EUROZINE.

A másik, általános jelleggel feltett kérdésre kevesebb válasz érkezett: Molnár Ivett (CEU) az XML-alapú sajtó-szolgáltatás helyzetére kérdezett rá. Úgy tűnik, ez a gyakorlat ebben  szakmai körben nem igazán népszerű. A moderátor megjegyzése: nemcsak a strukturált tartalomfeldolgozás, hanem a strukturált tartalom-reprodukció kérdése is több figyelmet igényelne. Ilyenek a komplex digitalizálási munkákhoz használt XML-alapú szabványok, mint pl. a METS-ALTO és egyes MPEG-21 specifikációk. Sajnos a rendezvényen ezekre nem tértünk ki bővebben.

Az általános kérdések után megkezdődött a résztvevők bemutatkozása.

Miután ABC-sorrendbn haladtunk, az első bemutatkozó Biszak Sándor volt, a magánszférából érkező résztvevők egyike, az Arcanum Adatbázis Kft. képviseletében. Elmondta, hogy cége – főleg közintézményekkel együttműködve – havonta 150/200.000 oldal digitalizált anyagot állít elő, a digitális facsimile technológiájával. Ez az oldalképet és a az optikai karakterfelismeréssel előállított szöveget tartalmazó kimenetet jelent. Ez az eljárás könnyen kivitelezhető, de szegényesen dokumentált, és bizonyos aspektusai nem ellenőrizhetők ill. kalibrálhatók. Ennek egyik oka a szoftveres támogatottság: az ABBYY Finereader jó hatékonyságú, de sok hibát tartalmazó (egyébként piacvezető) szoftver. Biszak Sándor szerint a PDF hosszú távon nem jó megoldás az internetes publikációra. Arra a kérdésre, hogy mit érdemes így digitalizálni, Biszak válasza: mindent, kivéve egyes természettudományos szakirodalmat (matematika, kémia, fizika). Ennek a körnek sajátos tartalmi jegyei miatt más, létező technológiát kell alkalmazni. Ezek utána az előadó bemutatta jelenleg folyó közgyűjteményi digitalizálási projektjét,melynek kimenete az nfo.arcanum.hu honlapon érhető el.

Biszak Sándor bemutatója kapcsán bontakozott ki az az alaptéma, mely a szekció egyik vezérmotívumának bizonyult: a PDF mint szolgáltatási megoldás. Biszak szerint a kétrétegű PDF esetén a 99%-ot közelítő karakterfelismerési pontosságra kell törekedni. Tóth Kornél rákérdezett: hogyan mérhető ez a minőség? Szükséges-e a korrektúra? Választ a második kérdésre kapott: ha korrektúrázni kell, akkor az OCR mint megoldás elvetendő. Kokas Károly (SZE) rámutat, hogy itt természetesen az oldalkép mögött található szövegindexre kell gondolni, melynek szerepe főleg a teljes szövegű keresésben van, arra pedig pár százalékponttal alacsonyabb pontossággal is megfelelő.

Molnár Ivett (CEU) felveti a PDF helyett az XML-alapú szolgáltatás lehetőségét. Káldos János (OSZK) rámutat, hogy a kettő között nem kizárt az átjárás, ha az Adobe MARS projektje célba ér, a PDF-formátum sokkal használhatóbb lesz strukturált információ tárolására. Biszak Sándor szerint a jelenlegi feldolgozási ráfordítással a struktúra úgyis elvész a digitalizált szöveganyagból, tehát a jelenlegi PDF-megoldás elég. Czupi Gyula felveti a felhasználói korrektúra lehetőségét. Ez azt jelenti, hogy a karakterfelismert anyag szolgáltatásánál biztosítani kell a felismert szöveg szerkeszthető nézetét, és így önkéntes felhasználók módosíthatnák a hibákat ill. kiegészíthetnék az esetleg hiányzó információt. Czupi a Wikipédiát hozza fel, mint az önkéntes hozzájárulás sikeres példáját. A moderátor megjegyzése: a francia nemzeti könyvtár jelenleg aktívan alkalmazza ezt a gyakorlatot.

Ezek után bemutatkoztak egyes megyei ill. városi intézményekből érkezett résztvevőink:

  • Békés Megyei Könyvtár - prezentáció nem készült, a főbb pontok: hangsúlyozzák a könyvtári sajtódigitalizálás pályázatfüggő jellegét. Jelenleg elérhető digitális folyóiratuk a Bárka, és XIX. századi helytörténeti jelentőségű lapok digitalizálását tervezik
  • Corvinus Egyetem, Budapest - prezentáció készült (1. Tartalom 2. Technológia)
  • Németh László Városi Könyvtár, Hódmezővásárhely - prezentáció készült
  • Kisfaludy Károly Megyei Könyvtár, Győr -  prezentáció nem készült, a főbb pontok: a digitalizálási feladatokat kiszervezéssel oldják meg. Folyamatos, regionális szempontok szerint összeállított tervek szerint dolgoznak. Az állományt az OSZK állományvédelmi digitalizálása keretében, részben a saját anyagaikból készült mikrofilmekkel egészítik ki. Problémájuk, melyekre orvoslatot szeretnének: az így előállított digitális anyag online publikációját az OSZK nem engedélyezi - a mikrofilmekre vonatkozó jogi megkötések okán, holott a mikrofilmek a siófoki állományból készültek.
  • Siófoki Városi Könyvtár - prezentáció nem készült, a főbb pontok: A siófoki sajtódigitalizálás a helyi sajtóadatbázis céljait szolgálja. Helyben szkennelnek, a Recognita OCR-szoftvert használják, a készült tartalmat a saját fejlesztésű "Bibliotéka" nevű adatbázis segítségével tárják fel. Kurrens regionális sajtófigyeléssel is foglalkoznak.
  • Miskolci Egyetem Könyvtára:  - prezentáció nem készült, a főbb pontok: házon belül digitalizálnak, igen sok technikai nehézséggel. Fő problémájuk a nagyméretű anyag feldolgozási, illetve a rossz állagú anyagok megőrzése. A Bányászati és Kohászati Lapok digitalizálását végezték el, most a Műegyetem c. lapon dolgoznak.

A könyvtárak bemutatkozása közben és után a résztvevők között kibontakozó beszélgetés tárgya főleg a technikai feltételekre irányult. Felmerült a digitalizáló berendezések beszerzésének kérdése, a közintézmények esetében az ezekkel kapcsolatos fő aggályok az ár illetve az állományvédelem jelentősége. Röviden összefoglalták a rendelkezésre álló berendezéseket: BookDrive, KIRTAS – milliós nagyságrendű beszerzések, illetve a kisebb, igénytelenebb berendezések, mint pl. az OpticBook. A DEENK képviselői nagyon jó javaslattal álltak elő: regionális összefogás keretében, több intézmény közösen beszerezhetne egy-egy igényesebb modellt (pl. KIRTAS), ez a digitalizálási projektek koordinálását is elősegíthetné. Biszak Sándor szerint a KIRTAS beszerzése az EU-ban nem is lehetséges. Mint a magánszféra képviselője, lebeszélné a könyvtárakat a saját digitalizálásról, mivel nem áll rendelkezésükre az eszköz és a kompetencia, inkább a digitalizálási munkák kiszervezését javasolja. Czupi Gyula ellenben könyvtári szakmai feladatnak érzi a sajtódigitalizálást, ezért nem látja célszerűnek a kiszervezést.

A rendezvény vége felé Moldován István beszélt röviden a vonatkozó szerzői jogi kérdésekről. Elmondta, hogy 2004 óta nincsen közös jogkezelés írott művekre (EU szabályozás miatt), ezt illetve ennek alternatíváját kellene helyreállítani a helyzet könnyebb kezelése érdekében. Beszélt továbbá az EU-n belül zajló jogharmonizációs folyamatokról is, melyek nagymértékben érintik a digitális felhasználás kérdését is.

A rendezvény hátralevő része kötetlen beszélgetéssel telt.

A moderátor megjegyzése: A szekció tanulsága számomra elsősorban az volt, hogy sokkal több lehetőségre lenne szükség a témában zajló kommunikáció bonyolítására. A rendezvény címe "sajtódigitalizálás a könyvtárban" volt, de látható, hogy a tágabb kategória, tehát közgyűjteményi digitalizálás témájában is közelíteni kellene a különböző gyakorlatokat, az erőforrások jobb megosztása érdekében, ami egyébként az együttműködés legfontosabb eleme. Azt is tisztázni kell, hogy mennyiben a szakma felelőssége és hatásköre a digitalizálás, illetve mik a lehetőségek arra nézve, hogy jobban érvényesüljenek a szakmai szempontok ezekben a folyamatokban. Az igazán a sajtót mint dokumentumtípust érintő módszertani kérdések megvitatására tulajdonképp csak mindezek áttekintése után kerülhetne sor.

Készítette a rendezvény moderátora: Renkecz Anita (Országos Széchényi Könyvtár)