MENÜ

 

Bakonyi DÓra:
keresÉsi lehetŐsÉgek Az Érdy-kÓdex internetes szÖvegkiadÁsÁban

 

Az Érdy-kódex hatalmas magyar nyelvű szöveganyag a 16. század első negyedéből. A leghosszabb kéziratos kódexeink között tartjuk számon. Valóságos kincsesbánya a magyar nyelvtörténet és irodalomtörténet kutatói számára, de emellett a történettudománnyal és az egyházi szövegekkel foglalkozó tudósok számára is.

Terjedelménél fogva nem készült el könyv formában a kritikai kiadása. Az ELTE Régi Magyar Irodalomtörténeti Tanszékén kezdődtek meg az eddig példa nélkül való internetes kritikai kiadás munkálatai.

Az irodalomtörténészek által készített kritikai szövegkiadásokra az a jellemző, hogy azokban mai magyarra „lefordított”, azaz átírt szövegeket kínálnak az olvasóközönségnek. Egy ilyen szöveg létrehozása mindig fájdalmas kompromisszumokat követel, a tudományos megbízhatóság rovására kell döntéseket hozni.

Hogy a jövőben az interneten elérhető kódexszöveg több kutatási célra is felhasználható legyen, úgy döntöttünk, hogy a nyelvtörténeti műhelyekben készülő kritikai kiadások módszerét választjuk elsődleges szövegkiadási elvül, alapul, ez pedig a betűhű átirat.

Magam a kezdetektől dolgozom a betűhű átirat számítógépes adatbázisként való megalkotásán; az átírási szabályok kialakításában is részt vettem. Laikusok gyakran teszik fel azt a kérdést, hogy ha van digitális fényképünk, akkor miért nem futtatunk le rajta egy betű- és karakterfelismerő programot? Erre a válasz az, hogy azért nem vezetne ez eredményre, mert a közel ötszáz éves kézirat nem egységes helyesírási szabályok szerint íródott. Tehát betűről betűre le kell másolnunk, nincs más választásunk.

 

A következő feladat a szöveg kereshetővé tétele, amely éppen az előbbi oknál fogva kíván némi előkészületet. Ebben a dolgozatban egy ilyen próbálkozást mutatok be.

A keresőprogramot tehát meg kell tanítani arra, hogy mit találjon meg, vagyis egy szótár jellegű adathalmazt kell összeállítani a szóalakok szabálytalan kavalkádjából.

Emellett vannak régi vagy régies szavak, amelyeket ma nem, vagy nem ugyanabban az alakban vagy jelentésben használunk. Abból érdemes tehát kiindulnunk, hogy a keresőprogram annál hatékonyabb, minél relevánsabb nyelvtörténetileg. A laikus érdeklődő vagy a kutató, amikor leül a számítógép elé, hogy az Érdy-kódexből kikeressen valamit, vagy csak olvasgassa, számára nehezen felismerhető szavakkal, szóalakokkal találkozhat. Amikor pedig a kutató a számára fontos kulcsszavakat keresi, azokat először mai alakjukban keresi. A magyar nyelv történeti-etimológiai szótára címszavaihoz hasonlítanak tehát ezek a „címszavak” is.

A ma is élő szavaknak a mai köznyelvi alakja szerepel, pl. ad

(a szótár adatsora: ad; adanak, adnak, atta volna, aad vala, agg/y:/ad)

 

A származékok is önálló „címszavak”, ebben viszont már eltérünk a TESz-től, pl. király, királyfi, királyi, királyság

(a szótár adatsorai:

király; kyralnak, k/y:/ralnak, k/y:/ral, k/y:/ral<...>, k/y:/ralban, k/y:/rall/y:/anak, k/y:/ralt

királyfi; k/y:/ral ff/y:/wnak, k/y:/ral ff/y:/wtwl

királyi; k/y:/ral/y:/, k/y:/raly

királyság; k/y:/ralsaghnak)

 

Ám hangsúlyoznunk kell, hogy itt nem hagyományos szótárírás a feladat, hanem egy keresőprogramba betáplálandó adathalmaz összeállítása. Nem az a cél, hogy leírjuk, hanem az, hogy megmutassuk a szavakat. Ez a hatékonyság mércéje.

Hogyan épülnek fel a „szócikkek”? Ha rákeresünk pl. a doktor szóra, akkor kapunk egy vagy több előforduló szóalakot (Ezek mind egy „címszó” alatt szerepelnek a szótárban: doktor; doctor, doct/2/, doctorok, doctoroknak)

1. Ha csak egy találat van, ez lehet írásmódjában azonos a mai szóval. (például: felette) De lehet, hogy a mai szokástól eltérően van leírva. (például: allat ´alatt´)

2. Ezen kívül a szóalakok lehetnek tőalakban vagy toldalékolva is, hiszen a keresőnek a konkrét szövegkörnyezettel együtt kell megmutatnia az eredményt. (pl. bűn, szent szócikkei:

bűn; b/y:/nt, b/y:/nnek, b/y:/nben, b/y:/ne, b/y:/ne/y:/t, b/y:/n/o´/k, b/y:/ne/y:/, b/y:/ne/y:/nkeert

szent; zent, z/e-/t, zent/o´/ket, zenth, zentnek

 

Néhány kiadott szövegkörnyezetre példa:

 

nwsaghnak okaert kerdees tamadhat .
m/y:/keppen lehet ez halando eeletben . ho/g”/
ember ennen magaban . az halalus b/y:/nt
megh /y:/smerhesse es ellene alhasson . Reea
(614a10)

ff/y:/wnak nag/y:/ t/y:/zt/o´/ssegeere es erdemee
re / m/y:/nt /y:/obban megh hall/y:/a(.) az ew z/e-/t
eeleteeben . k/y:/r/o´/l wg/y:/ mond zent Ieroni/9/
doctor . Az zent Ang/y:/aloknak rokon k/o´/zel/o´/k
(614a49)

sem talalanak meg benne . Ottan . m/y:/nd
k/y:/k ott valanak nag/y:/ d/y:/cheeret/o´/t es hal
aat adanak ra/y:/tta wr istennek es z/y:/z z/e-/t
/y:/mre Confessornak . m/y:/ ees m/y:/nd ezek
(617b15)

 

Ezekből láthatjuk, hogy a keresőprogramunk mi mindent tud.

 

Nézzük meg, hogy mi mindenre képes:

 

1. A „címszóra” keresve tehát (mint láttuk) kidobja az egyes előfordulásokat, és megmutatja a közvetlen szövegkörnyezetüket (oldalszámmal és sorszámmal).

2. Az egyes szóalakokra keresve pedig képes kiadni a mai magyar „címszót”. Ha innen indulunk a keresésben, akkor megtalálhatjuk az „alapalakot”. Pl.: z/e-/t à szent

A betűhű szöveget továbbá be is lehet linkelni más szövegekhez az interneten. Például, mivel az Érdy-kódex nagyrészt fordítás latinból, a jelen szövegnek kutatómunkával már megállapított latin forrásaihoz. A kódex más szövegekhez fűződő viszonyrendszerének az összefoglaló feltárása a kritikai kiadásban alapkövetelmény.

Szerencsére az Imre-legendának éppen hozzáférhető a megállapított latin forrása (kettő is): ezek Temesvári Pelbárt-szövegek. Bizonyos részeik megfeleltethetők a magyar szöveg egyes részeinek, vagyis szövegrészeket köthetünk össze egymásra utaló linkekkel. Ez Kisszebeni Krisztina munkája. Pl. az Érdy-kódex 613a hasábja a 14. sortól a végéig az alábbi kiemelt szöveghelyeken köthető össze a Pelbárt-szöveggel:

 

Ett lezen emlek/o´/zet
zent emre kyral/-/
nak Innepeer/o´/l .
Wr Iesusban cristusban zerelmes a/-/
t/y:/amff/y:/a/y:/ /y:/me An/y:/azent eg/y:/haaz
eztendew fordwlatt/y:/aban elewnkbe
hozta . Ez nemes Idwesseeghnek forma/y:/
aat . /y:/o eelethnek t/y:/k/o´/reet . zeep liliom
v/y:/raghnak eedes /y:/llatt/y:/aat z/y:/z es zent
emre k/y:/ral ff/y:/wnak aldot /y:/nnepeet
k/y:/t m/y:/keppen wr isten malaztt/y:/anak
m/y:/atta zent g/y:/ekerr/o´/l zarmazeek azo
nkeppen [e]z nemes [v]/y:/ragzaal k/y:/lemb k/y:/lemb zent g/y:/mel
choket teremte es eerlele ew eeletee
ben . k/y:/nek zeep /y:/llatt/y:/aat megh er
ezween *613a1*az ew zent att/y:/a / meltan
mondhataa : az zent /y:/saak /p-/riarcha
nak mondasaat : Iacob ff/y:/arol .
*613a1* Es Ia
cob zemeel/y:/eeben wrwnk Iesus Cris
tusrol k/y:/nek nemzeteeb/o´/l z/y:/leteek te
stzerent az aldot istennek zent ff/y:/a
k/y:/ meg vag/y:/on /y:/rwan *613a2*Genesis xxvij
yme az en ff/y:/amnak zeep /y:/llatt/y:/a
m/y:/nt az
*613a2* zeep v/y:/ragokkal *613a2*t/o´/lt mez/o´/
nek /y:/llatt/y:/a . k/y:/t megh aldot az wr
isten
*613a2* : Ezenkeppen d/y:/ch/o´/seeges z/y:/z zent
emre k/y:/ralnak ees az sok v/y:/ragzo le
lk/y:/ /y:/ozagoknak m/y:/atta . zeep . eedes . /y:/o
es g/y:/en/y:/er/w”/seeges vala lathn/y:/ hal
lan/y:/ es erezn/y:/ m/y:/ndennemew dolgat
teetemeen/y:/eet : k/y:/nek d/y:/ch/o´/seeges
emlek/o´/zet/y:/re harom rendbel/y:/ lelk/y:/
tanwsagwnk leezen . wr istennek
segheedseegewel : =

 

            A latin forráshelyek: Pelbartus: Pomerium de sanctis, Pars aestivalis Sermo XC. De sancto Emerico Sermo primus cum legenda:

 

Haec verba sunt Isaac ad suum filium, optime tamen potest dicere beatus rex Stephanus de filio suo sancto Emerico, nam sicut odor bonus est delectabilis et gratus hominibus, ita sanctitas beati Emerici delectabilis et grata Deo ac angelis et beatis.

Ecce odor filii mei, sicut odor agri pleni, cui benedixit Dominus. Gen. XXVII. 1(A)

 

Kiszemezhetünk azonban szószintű latin-magyar megfeleléseket is a szövegekből. Ezt a latin-magyar „szótárat” magyar-latin irányúvá alakítva beépítettük a szótárba. (Pl. akarat szótári adatsora: akarat; akaratt/y:/aat, akaratoknak xxx voluntas)

Ebből hosszú távon, komoly kutatómunka eredményeként az Érdy-kódex írójának a fordítói gyakorlatáról kaphatunk képet.

A kritikai kiadás keretein már túllépve, nyelvészeti kutatómunkával újabb adatbázist hozhatunk létre az Érdy-kódex szövegéből: magam egy mondattanilag annotált korpuszt készítek a doktori disszertációm keretében. De bármely más terület bármely kutatási szempontjából adatbázissá alakítható a betűhű alapszöveg.

Visszatérve a jelenlegi keresőprogramra: ennek segítségével az Érdy-kódex széles kutatórétegek számára válik felhasználhatóvá kutatási segédeszközként, valamint forrásként. Lehet vizsgálni majd a magyar nyelvtörténeti kérdések mellett irodalomtörténeti jelenségeket, például a Karthauzi Névtelen fordítói munkásságát, de tágabb irodalom- és művelődéstörténeti keretekben akár a magyar bibliafordítások párhuzamosságait, valamint még szélesebb látószögből például egyes hagiográfiai motívumok vándorlását szerzőkön, de akár korokon és nyelveken keresztül is.

Zárszóként pedig emlékeztetnék arra, hogy a latin lévén a medievisztika nyelve, az Érdy-kódex középlatin szövegekkel való kapcsolatainak kiépítése a mai nemzetközi kutatóközösségekhez és nemzeteket összekötő kutatási programokhoz is utat nyit. Tegyük hozzáférhetővé nemzeti és nyelvi örökségünk e fölöttébb értékes darabját.

 

Szabályzat a konkordanciaszótár elkészítéséhez

 

1. Konkordanciaszótár csak végleges betűhű átiratból készülhet.

2. Az alapszöveg: az Érdy-kódex magyar nyelvű szövege. Kihagyjuk tehát az összefüggő latin szövegrészeket (mondatokat, félmondatokat) és a bibliai idézetek megjelöléseit (pl.: Sa/p-/ iij , Math xv , stb.). Nem hagyjuk ki a feldolgozásból a magyar szövegben, magyar szónak tekinthető latin vagy más szavakat, neveket. (Pl. psalmus ´zsoltár´, Bernaldus, amen, stb.) A jegyzeteket természetesen kihagyjuk, hiszen azok nem képezik a kódexszöveg részét.

3. Semmi mást nem hagyunk ki a feldolgozásból! Ha nem vagyunk biztosak benne, hogy mi legyen a címszó, akkor kerek zárójelek közé tett kérdőjelet teszünk az ideiglenes címszó után, vagy annak helyére: (?) .

4. A szótár Wordben készül, fájlformátum: doc.

5. A szótár tartalma: szócikkek. Ezek mindegyikében vannak: címszavak és szóelőfordulások.

6. A szótár formája: minden szócikk egy új sorba kerül (Enter a sor végén). A címszó kisbetűvel kezdődik (ha nem név). Címszó után pontosvessző; ezután jönnek a szóelőfordulások. Nem kell semmilyen locust megadni (se oldalszám, se hasáb, se sorszám, semmi nem kell). Tehát bármelyik szóelőforduláshoz több adat is tartozhat az kódexszövegben. A keresőprogram ezt találja meg, és mutatja meg a keresés eredményeként.

7. Címszó = mai helyesírás szerinti alak, tő, származék (képzett szó), igekötős ige, összetett szó, tulajdonnév. Az igéknél az igenévi alakokat nem vesszük külön címszónak. (pl.: tart; tarth, tartottaak, tarthwaan, tartwan, tartotta volna, tartan/y:/, stb.) Azonos alakú címszavakhoz kerek zárójelben szófaji megkülönböztetést teszünk. Pl.:

mi (kérdő nm.)
mi (von. nm.+egyéb)
mi (szem. nm.)

8. Szóelőfordulások, szóalakok = az összes írásváltozat + a címszó toldalékolt alakjai. Ha ige, akkor pl. időbeli és egyéb segédigékkel együtt is (pl.: tartotta volna, tartan/y:/ kezdette vona). Törölt szórészt tartalmazó szóelőfordulások is (pl.: k/y:/ral<...>, ze<.>nt, stb.). Rövidítést tartalmazó szóelőfordulások is (pl.: z/e-/t, xpus, doct/2/). Olvashatatlan részt tartalmazó szavak is, ha azonosítható, hogy mit jelent a szó (pl.: d/y:/che(..)eeges a dicsőséges címszó alá). Az elválasztott szavakat természetesen elválasztás nélküli formájukban vesszük föl. Ha írásjel esik valamiért egy szóelőfordulás tagjai közé, azt is felvesszük (pl.: hallotta . volna, /y:/rtta . meg, stb.). A szó eleji nagybetű megkülönböztetése nem szükséges a szóelőfordulások esetében.

9. A szótárnak nyelvtörténetileg relevánsnak kell lennie, ehhez a megfelelő energiát és munkát be kell fektetni. Kívánatos a TESz., a NySz., az EWUng. címszavainak tanulmányozása. A saját munkánkat folyamatosan, több alkalommal ellenőrizni szükséges. A bizonytalanságokat ebben a munkafázisban szükséges velejárónak kell tekinteni; nem kell mindenáron biztos, sarkított választ adnunk a felmerülő kérdésekre.

 

 

Bakonyi, Dóra: Lexical search possibilities in the on-line critical edition of the Érdy Codex


The Érdy Codex (1526-27) is the biggest Hungarian manuscript collection of sermons and legends. Its on-line critical edition opens up vast lexical search possibilities. The author of the essay has been working on the literal transcription of the text. The lexical search programme has to be fed a list of dictionary entries extracted by hand from the literal transcription; in the process, facts of historical linguistics have to be regarded. But only to a certain extent; the main goal is to show keywords, possibly in their modern form, for researchers to be able to find. Each entry in the dictionary contains a list of all the spelling variants as well as all the inflected forms of the head lexical element occurring in the manuscript. Furthermore, the search programme lists the concrete data in four lines of context. The spelling variants themselves are valid search elements. In the future, a Latin-Hungarian lexical concordance dictionary may be aligned to this existing one.