Bakonyi DÓra:
keresÉsi lehetŐsÉgek Az Érdy-kÓdex internetes
szÖvegkiadÁsÁban
Az Érdy-kódex hatalmas magyar nyelvű szöveganyag a 16.
század első negyedéből. A leghosszabb kéziratos kódexeink között tartjuk
számon. Valóságos kincsesbánya a magyar nyelvtörténet és irodalomtörténet
kutatói számára, de emellett a történettudománnyal és az egyházi szövegekkel foglalkozó tudósok számára is.
Terjedelménél
fogva nem készült el könyv formában a kritikai kiadása. Az ELTE Régi Magyar
Irodalomtörténeti Tanszékén kezdődtek meg az eddig példa nélkül való internetes
kritikai kiadás munkálatai.
Az
irodalomtörténészek által készített kritikai szövegkiadásokra az a jellemző,
hogy azokban mai magyarra „lefordított”, azaz átírt szövegeket kínálnak az
olvasóközönségnek. Egy ilyen szöveg létrehozása mindig fájdalmas
kompromisszumokat követel, a tudományos megbízhatóság rovására kell döntéseket
hozni.
Hogy a jövőben az interneten
elérhető kódexszöveg több kutatási célra is felhasználható legyen, úgy
döntöttünk, hogy a nyelvtörténeti műhelyekben készülő kritikai kiadások
módszerét választjuk elsődleges szövegkiadási elvül, alapul, ez pedig a betűhű átirat.
Magam a kezdetektől dolgozom a
betűhű átirat számítógépes adatbázisként való megalkotásán; az átírási
szabályok kialakításában is részt vettem. Laikusok gyakran teszik fel azt a
kérdést, hogy ha van digitális fényképünk, akkor miért nem futtatunk le rajta
egy betű- és karakterfelismerő programot? Erre a válasz az, hogy azért nem
vezetne ez eredményre, mert a közel ötszáz éves kézirat nem egységes
helyesírási szabályok szerint íródott. Tehát betűről betűre le kell másolnunk,
nincs más választásunk.
A következő feladat a szöveg kereshetővé tétele, amely éppen
az előbbi oknál fogva kíván némi előkészületet. Ebben a dolgozatban egy ilyen
próbálkozást mutatok be.
A keresőprogramot tehát meg kell
tanítani arra, hogy mit találjon meg, vagyis egy szótár jellegű adathalmazt
kell összeállítani a szóalakok szabálytalan kavalkádjából.
Emellett vannak régi vagy régies
szavak, amelyeket ma nem, vagy nem ugyanabban az alakban vagy jelentésben
használunk. Abból érdemes tehát kiindulnunk, hogy a keresőprogram annál
hatékonyabb, minél relevánsabb nyelvtörténetileg. A laikus érdeklődő vagy a
kutató, amikor leül a számítógép elé, hogy az Érdy-kódexből kikeressen valamit,
vagy csak olvasgassa, számára nehezen felismerhető szavakkal, szóalakokkal
találkozhat. Amikor pedig a kutató a számára fontos kulcsszavakat keresi,
azokat először mai alakjukban keresi. A magyar nyelv történeti-etimológiai
szótára címszavaihoz hasonlítanak tehát ezek a „címszavak” is.
A ma is élő szavaknak a mai
köznyelvi alakja szerepel, pl. ad
(a szótár adatsora: ad; adanak, adnak, atta volna,
aad vala, agg/y:/ad)
A származékok is önálló
„címszavak”, ebben viszont már eltérünk a TESz-től, pl. király,
királyfi, királyi, királyság
(a szótár adatsorai:
király; kyralnak, k/y:/ralnak,
k/y:/ral, k/y:/ral<...>, k/y:/ralban, k/y:/rall/y:/anak, k/y:/ralt
királyfi; k/y:/ral ff/y:/wnak,
k/y:/ral ff/y:/wtwl
királyi; k/y:/ral/y:/, k/y:/raly
királyság; k/y:/ralsaghnak)
Ám hangsúlyoznunk kell, hogy itt nem hagyományos
szótárírás a feladat, hanem egy keresőprogramba betáplálandó adathalmaz
összeállítása. Nem az a cél, hogy leírjuk, hanem az, hogy megmutassuk a
szavakat. Ez a hatékonyság mércéje.
Hogyan épülnek fel a „szócikkek”?
Ha rákeresünk pl. a doktor szóra, akkor kapunk
egy vagy több előforduló szóalakot (Ezek mind egy „címszó” alatt szerepelnek a szótárban:
doktor; doctor, doct/2/, doctorok, doctoroknak)
1. Ha csak egy találat van, ez lehet írásmódjában
azonos a mai szóval. (például: felette) De lehet, hogy a mai szokástól
eltérően van leírva. (például: allat ´alatt´)
2. Ezen kívül a szóalakok
lehetnek tőalakban vagy toldalékolva is, hiszen a keresőnek a
konkrét szövegkörnyezettel együtt kell megmutatnia az eredményt. (pl. bűn,
szent szócikkei:
bűn;
b/y:/nt, b/y:/nnek, b/y:/nben, b/y:/ne, b/y:/ne/y:/t, b/y:/n/o´/k, b/y:/ne/y:/,
b/y:/ne/y:/nkeert
Néhány kiadott szövegkörnyezetre példa:
nwsaghnak okaert kerdees tamadhat .
m/y:/keppen lehet ez halando eeletben . ho/g”/
ember ennen magaban . az halalus b/y:/nt
megh /y:/smerhesse es ellene alhasson . Reea
(614a10)
ff/y:/wnak nag/y:/ t/y:/zt/o´/ssegeere es erdemee
re / m/y:/nt /y:/obban megh hall/y:/a(.) az ew z/e-/t
eeleteeben . k/y:/r/o´/l wg/y:/ mond zent Ieroni/9/
doctor . Az zent Ang/y:/aloknak rokon k/o´/zel/o´/k
(614a49)
sem talalanak meg benne . Ottan . m/y:/nd
k/y:/k ott valanak nag/y:/ d/y:/cheeret/o´/t es hal
aat adanak ra/y:/tta wr istennek es z/y:/z z/e-/t
/y:/mre Confessornak . m/y:/ ees m/y:/nd ezek
(617b15)
Ezekből láthatjuk, hogy a
keresőprogramunk mi mindent tud.
Nézzük meg, hogy mi mindenre képes:
1. A
„címszóra” keresve tehát (mint láttuk) kidobja az egyes előfordulásokat, és
megmutatja a közvetlen szövegkörnyezetüket (oldalszámmal és sorszámmal).
2. Az egyes szóalakokra keresve pedig képes kiadni a mai magyar „címszót”. Ha innen indulunk a keresésben,
akkor megtalálhatjuk az „alapalakot”. Pl.: z/e-/t à szent
A betűhű szöveget továbbá be is
lehet linkelni más szövegekhez az interneten. Például, mivel az Érdy-kódex
nagyrészt fordítás latinból, a jelen szövegnek kutatómunkával már megállapított
latin forrásaihoz. A kódex más szövegekhez fűződő viszonyrendszerének az összefoglaló
feltárása a kritikai kiadásban alapkövetelmény.
Szerencsére az Imre-legendának
éppen hozzáférhető a megállapított latin forrása (kettő is): ezek Temesvári
Pelbárt-szövegek. Bizonyos részeik megfeleltethetők a magyar szöveg egyes
részeinek, vagyis szövegrészeket köthetünk össze egymásra utaló
linkekkel. Ez Kisszebeni Krisztina munkája. Pl. az Érdy-kódex 613a hasábja a
14. sortól a végéig az alábbi kiemelt szöveghelyeken köthető össze a
Pelbárt-szöveggel:
Ett lezen emlek/o´/zet
zent emre kyral/-/
nak Innepeer/o´/l .
Wr Iesusban cristusban zerelmes a/-/
t/y:/amff/y:/a/y:/ /y:/me An/y:/azent eg/y:/haaz
eztendew fordwlatt/y:/aban elewnkbe
hozta . Ez nemes Idwesseeghnek forma/y:/
aat . /y:/o eelethnek t/y:/k/o´/reet . zeep liliom
v/y:/raghnak eedes /y:/llatt/y:/aat z/y:/z es zent
emre k/y:/ral ff/y:/wnak aldot /y:/nnepeet
k/y:/t m/y:/keppen wr isten malaztt/y:/anak
m/y:/atta zent g/y:/ekerr/o´/l zarmazeek azo
nkeppen [e]z nemes [v]/y:/ragzaal k/y:/lemb k/y:/lemb zent g/y:/mel
choket teremte es eerlele ew eeletee
ben . k/y:/nek zeep /y:/llatt/y:/aat megh er
ezween *613a1*az ew zent att/y:/a / meltan
mondhataa : az zent /y:/saak /p-/riarcha
nak mondasaat : Iacob ff/y:/arol . *613a1* Es Ia
cob zemeel/y:/eeben wrwnk Iesus Cris
tusrol k/y:/nek nemzeteeb/o´/l z/y:/leteek te
stzerent az aldot istennek zent ff/y:/a
k/y:/ meg vag/y:/on /y:/rwan *613a2*Genesis xxvij
yme az en ff/y:/amnak zeep /y:/llatt/y:/a
m/y:/nt az*613a2* zeep v/y:/ragokkal *613a2*t/o´/lt mez/o´/
nek /y:/llatt/y:/a . k/y:/t megh aldot az wr
isten*613a2* : Ezenkeppen d/y:/ch/o´/seeges z/y:/z zent
emre k/y:/ralnak ees az sok v/y:/ragzo le
lk/y:/ /y:/ozagoknak m/y:/atta . zeep . eedes . /y:/o
es g/y:/en/y:/er/w”/seeges vala lathn/y:/ hal
lan/y:/ es erezn/y:/ m/y:/ndennemew dolgat
teetemeen/y:/eet : k/y:/nek d/y:/ch/o´/seeges
emlek/o´/zet/y:/re harom rendbel/y:/ lelk/y:/
tanwsagwnk leezen . wr istennek
segheedseegewel : =
A
latin forráshelyek: Pelbartus: Pomerium de sanctis, Pars aestivalis Sermo XC.
De sancto Emerico Sermo primus cum legenda:
Haec verba sunt
Isaac ad suum filium, optime tamen potest dicere beatus rex Stephanus de filio
suo sancto Emerico, nam sicut odor bonus est delectabilis et gratus hominibus,
ita sanctitas beati Emerici delectabilis et grata Deo ac angelis et beatis.
Ecce odor
filii mei, sicut odor agri pleni, cui benedixit Dominus. Gen. XXVII. 1(A)
Kiszemezhetünk
azonban szószintű latin-magyar megfeleléseket is a szövegekből. Ezt a
latin-magyar „szótárat” magyar-latin irányúvá alakítva beépítettük a szótárba.
(Pl. akarat szótári adatsora:
akarat; akaratt/y:/aat, akaratoknak xxx voluntas)
Ebből hosszú távon, komoly
kutatómunka eredményeként az Érdy-kódex írójának a fordítói gyakorlatáról
kaphatunk képet.
A kritikai kiadás keretein már
túllépve, nyelvészeti kutatómunkával újabb adatbázist hozhatunk létre az
Érdy-kódex szövegéből: magam egy mondattanilag annotált korpuszt készítek a
doktori disszertációm keretében. De bármely más terület bármely kutatási
szempontjából adatbázissá alakítható a betűhű alapszöveg.
Visszatérve a jelenlegi
keresőprogramra: ennek segítségével az Érdy-kódex széles kutatórétegek számára
válik felhasználhatóvá kutatási segédeszközként, valamint forrásként. Lehet
vizsgálni majd a magyar nyelvtörténeti kérdések mellett irodalomtörténeti
jelenségeket, például a Karthauzi Névtelen fordítói munkásságát, de tágabb
irodalom- és művelődéstörténeti keretekben akár a magyar bibliafordítások
párhuzamosságait, valamint még szélesebb látószögből például egyes hagiográfiai
motívumok vándorlását szerzőkön, de akár korokon és nyelveken keresztül is.
Zárszóként pedig
emlékeztetnék arra, hogy a latin lévén a medievisztika nyelve, az Érdy-kódex
középlatin szövegekkel való kapcsolatainak kiépítése a mai nemzetközi
kutatóközösségekhez és nemzeteket összekötő kutatási programokhoz is utat nyit.
Tegyük hozzáférhetővé nemzeti és nyelvi örökségünk e fölöttébb értékes
darabját.
Szabályzat a konkordanciaszótár
elkészítéséhez
1.
Konkordanciaszótár csak végleges betűhű átiratból készülhet.
2. Az
alapszöveg: az Érdy-kódex magyar nyelvű szövege. Kihagyjuk tehát az összefüggő
latin szövegrészeket (mondatokat, félmondatokat) és a bibliai idézetek
megjelöléseit (pl.: Sa/p-/ iij , Math xv , stb.). Nem
hagyjuk ki a feldolgozásból a magyar szövegben, magyar szónak tekinthető latin
vagy más szavakat, neveket. (Pl. psalmus ´zsoltár´, Bernaldus, amen, stb.) A jegyzeteket természetesen kihagyjuk, hiszen azok nem
képezik a kódexszöveg részét.
3. Semmi mást
nem hagyunk ki a feldolgozásból! Ha nem vagyunk biztosak benne, hogy mi legyen
a címszó, akkor kerek zárójelek közé tett kérdőjelet teszünk az ideiglenes
címszó után, vagy annak helyére: (?) .
4. A szótár
Wordben készül, fájlformátum: doc.
5. A szótár
tartalma: szócikkek. Ezek mindegyikében vannak: címszavak és szóelőfordulások.
6. A szótár formája: minden szócikk egy új sorba kerül (Enter a sor végén). A címszó kisbetűvel kezdődik (ha nem név). Címszó után pontosvessző; ezután jönnek a szóelőfordulások. Nem kell semmilyen locust megadni (se oldalszám, se hasáb, se sorszám, semmi nem kell). Tehát bármelyik szóelőforduláshoz több adat is tartozhat az kódexszövegben. A keresőprogram ezt találja meg, és mutatja meg a keresés eredményeként.
7. Címszó = mai helyesírás szerinti alak, tő, származék (képzett szó), igekötős ige, összetett szó, tulajdonnév. Az igéknél az igenévi alakokat nem vesszük külön címszónak. (pl.: tart; tarth, tartottaak, tarthwaan, tartwan, tartotta volna, tartan/y:/, stb.) Azonos alakú címszavakhoz kerek zárójelben szófaji megkülönböztetést teszünk. Pl.:
mi (kérdő nm.)
mi (von. nm.+egyéb)
mi (szem. nm.)
8. Szóelőfordulások, szóalakok = az összes írásváltozat + a címszó toldalékolt alakjai. Ha ige, akkor pl. időbeli és egyéb segédigékkel együtt is (pl.: tartotta volna, tartan/y:/ kezdette vona). Törölt szórészt tartalmazó szóelőfordulások is (pl.: k/y:/ral<...>, ze<.>nt, stb.). Rövidítést tartalmazó szóelőfordulások is (pl.: z/e-/t, xpus, doct/2/). Olvashatatlan részt tartalmazó szavak is, ha azonosítható, hogy mit jelent a szó (pl.: d/y:/che(..)eeges a dicsőséges címszó alá). Az elválasztott szavakat természetesen elválasztás nélküli formájukban vesszük föl. Ha írásjel esik valamiért egy szóelőfordulás tagjai közé, azt is felvesszük (pl.: hallotta . volna, /y:/rtta . meg, stb.). A szó eleji nagybetű megkülönböztetése nem szükséges a szóelőfordulások esetében.
9. A szótárnak nyelvtörténetileg relevánsnak kell lennie, ehhez a megfelelő energiát és munkát be kell fektetni. Kívánatos a TESz., a NySz., az EWUng. címszavainak tanulmányozása. A saját munkánkat folyamatosan, több alkalommal ellenőrizni szükséges. A bizonytalanságokat ebben a munkafázisban szükséges velejárónak kell tekinteni; nem kell mindenáron biztos, sarkított választ adnunk a felmerülő kérdésekre.
Bakonyi, Dóra: Lexical search possibilities in the on-line critical edition of the Érdy Codex
The Érdy Codex (1526-27) is the biggest Hungarian manuscript collection of sermons and legends. Its on-line critical edition opens up vast lexical search possibilities. The author of the essay has been working on the literal transcription of the text. The lexical search programme has to be fed a list of dictionary entries extracted by hand from the literal transcription; in the process, facts of historical linguistics have to be regarded. But only to a certain extent; the main goal is to show keywords, possibly in their modern form, for researchers to be able to find. Each entry in the dictionary contains a list of all the spelling variants as well as all the inflected forms of the head lexical element occurring in the manuscript. Furthermore, the search programme lists the concrete data in four lines of context. The spelling variants themselves are valid search elements. In the future, a Latin-Hungarian lexical concordance dictionary may be aligned to this existing one.