GenDB

Aufbau einer Genealogischen Datenbank aus Einträgen von Kirchenbüchern

Die Ar­chi­ve der euro­päi­schen Bi­stü­mer ber­gen ei­nen im­men­sen In­for­ma­tions­schatz, den na­he­zu kom­plet­ten Ab­stam­mungs- und Ver­wandt­schafts­plan der Be­völ­ke­rung seit An­fang der Auf­zeich­nung im 14./15. Jahr­hun­dert. Ihn zu sich­ten und zu si­chern ist eine große so­zia­le Auf­ga­be der näch­sten Jahr­zehn­te.

Der un­ab­läs­si­ge Wett­lauf ge­gen den be­stän­dig fort­schrei­ten­den na­tür­li­chen Ver­fall der zu Grun­de lie­gen­den Me­di­en zwingt zu ra­schem Han­deln und viel­sei­ti­gem Ein­satz so­wohl mo­der­ner Da­ten­spei­che­rungs­tech­nik als auch um­fang­rei­cher per­so­nel­ler Res­sour­cen, um – durch stän­di­ges Ko­pie­ren und Neu­or­ga­ni­sie­ren – dem end­gül­ti­gen Ver­lust im­mer ei­nen Schritt vor­aus zu sein. Wäh­rend in frü­he­ren Zei­ten dies vor Al­lem durch hand­schrift­li­ches Ver­viel­fäl­ti­gen be­werk­stel­ligt wur­de, er­setzt heut­zu­ta­ge und in Zu­kunft das elek­tro­ni­sche Ko­pie­ren auf das im Au­gen­blick tech­no­lo­gisch op­ti­ma­le Me­di­um die ma­nu­el­le In­for­ma­tions­si­che­rung.

Im er­sten Schritt ist je­doch die Er­fas­sung der Hand­schrif­ten in elek­tro­ni­scher Form zu be­wäl­ti­gen. Auf­grund der un­zu­rei­chen­den Qua­li­tät der Ein­ga­be­da­ten er­scheint die auto­ma­ti­sche Er­fas­sung durch OCR-Ver­fah­ren aus­sichts­los. So­mit bleibt nichts an­de­res üb­rig, als sich auf die ma­nu­el­le Er­fas­sung zu­rück­zu­zie­hen.

Lohn des Gan­zen ist eine mas­sive Aus­wei­tung der Mög­lich­kei­ten zu Re­cher­che und For­schung un­ter gleich­zei­tig er­heb­lich re­du­zier­ter me­cha­ni­scher Be­las­tung der wert­vol­len Bü­cher.

Projektinhalt
 

In Zu­sam­men­ar­beit mit dem Ar­chiv des Bis­tum Pas­sau (Kar­te der Pfarrei­en) wurde ein Pro­gramm ent­wi­ckelt, um die dort la­gern­den Kir­chen­bü­cher (Aus­zug 100kB) sys­te­ma­tisch in einer ge­ne­a­lo­gi­schen Da­ten­bank zu er­fas­sen.

Besonderes Au­gen­merk galt hier­bei fol­gen­den As­pek­ten:

  • Einer mög­lichst ef­fi­zien­ten Ein­gabe­un­ter­stüt­zung, da es sich ins­g­esamt um ca. 6000 Kir­chen­bü­cher mit et­wa 4 Mil­lio­nen Ein­trä­gen han­delt.

  • Einer fle­xi­bel an­pass­ba­ren Ober­flä­che, mit der sich die teils stark va­riieren­den Da­ten be­quem und ef­fi­zient er­fas­sen las­sen.

  • Der Per­so­nen­da­ten­zu­sam­men­füh­rung, d.h. es soll nach der Ein­gabe ver­sucht wer­den, die ein­zel­nen Vor­kom­men der glei­chen Per­son an ver­schie­de­nen Stel­len in den Ma­tri­keln zu iden­ti­fi­zie­ren (evtl. un­ter ab­wei­chen­den Na­mens­schrei­bun­gen, Ge­burts­da­ten etc.) und somit den lo­gi­schen Zu­sam­men­­hang aus den ver­schie­de­nen Ein­tra­gun­gen her­zu­stel­len (der­zeit noch nicht fer­tig im­ple­men­tiert, aber in Ar­beit)

Als Folge der Per­so­nen­da­ten­zu­sam­men­füh­rung er­gibt sich die Mög­lich­keit einer fast voll­auto­mati­schen Stamm­baum­er­stel­lung. Über die er­fass­ten Daten sind dabei bei­na­he be­lie­bi­ge Ab­fra­gen mög­lich. Be­reits jetzt pro­fi­tiert das Ar­chiv von den einge­ge­be­nen Re­gis­ter­da­ten, da nun erst­­mals Per­so­nen ohne ge­naue Kennt­nis der da­ma­li­gen Wohn­ge­gend re­­cher­chiert wer­den kön­nen.

Technische Details
 

Das Pro­gramm ist wei­test­ge­hend platt­form­un­ab­hän­gig, da es voll­stän­dig in Java im­ple­men­tiert wur­de (soweit ge­tes­tet un­ter UNIX und Windows NT/2000/XP). Es kann in Netz­werk- und Ein­zel­platz­sys­te­men ein­ge­setzt wer­den. Voraus­set­zung ist ein Da­ten­bank­sys­tem, das dem ANSI SQL-Stan­dard ent­spricht.

Im Pas­sau­er Ar­chiv ist ein UNIX-Netz­werk (So­la­ris 2.6) mit et­wa 10 Linux-Clients im Ein­satz, wo­von 5 Clients al­lein für die Da­ten­ein­ga­be be­nutzt wer­den. Es wird ein Da­ten­bank­ser­ver ver­wen­det auf wel­chem das Da­ten­bank­sy­stem Oracle 9i in­stal­liert ist. Das Sy­stem kann in­zwi­schen auch off­line mit Post­gre­SQL Da­ten­ban­ken be­trie­ben wer­den.

Aktueller Stand
 

In der ers­ten Pha­se des Pro­jek­tes wur­den die kom­plet­ten Trau­ungs­re­gis­ter der Kir­chen­bü­cher ein­ge­ge­ben. Die Ein­gabe der zu­ge­hö­ri­gen Ma­tri­kel­ein­trä­ge ist er­heb­lich fort­ge­schrit­ten, stag­niert aber in­zwi­schen auf­grund Per­so­nal­man­gels.

Statt­des­sen kon­zen­triert sich das Ar­chiv in­zwi­schen auf die Di­gi­ta­li­sie­rung der Quel­len selbst, in­dem die­se mit ei­nem Buch­scan­ner ab­foto­gra­fiert wer­den. Die Er­fas­sung soll in Zu­kunft un­ter Be­nut­zung die­ser Auf­nah­men durch­ge­führt wer­den, um die Aus­he­bung und Ein­la­ge­rung der Bü­cher zu spa­ren, und die­se so zu scho­nen.

Der In­halt der Da­ten­bank wird in­zwi­schen auch zu me­di­zi­ni­schen For­schungs­zwe­cken ge­nutzt. Ins­be­son­de­re zur Er­for­schung der Alz­hei­mer-Früh­form (ver­mut­lich ein Gen­de­fekt) wur­den ver­wandt­schaft­li­che Be­zieh­un­gen aus­ge­wer­tet und Stamm­bäume auf­ge­baut. Da­bei wur­den wei­te­re Ver­dachts­fäl­le aus der Ver­gan­gen­heit ent­deckt. Mög­lich wur­den die­se Un­ter­su­chun­gen durch den Um­stand, dass der zwei­te von Dr. Alz­heimer un­ter­such­te Pa­tient in der da­ma­li­gen Diö­ze­se Pas­sau leb­te, eben­so wie vie­le sei­ner Nach­kom­men.

Ausblick
 

Die Dauer der voll­stän­di­gen Er­fas­sung al­ler Ma­tri­keln lässt sich nur schwer ab­schät­zen, es ist je­doch mit min­des­tens 10 Jah­ren Ar­beits­zeit zu rech­nen.

Ei­ne Aus­wei­tung des Pro­jekts auf an­de­re Bis­tü­mer (auch in Öster­reich) wird er­hofft, ist aber noch nicht kon­kret. Eine Be­reit­stel­lung der Da­ten im In­ter­net ist zur Zeit nicht ge­plant, da so­wohl die recht­liche als auch fi­nan­ziel­le Si­tua­tion noch nicht ge­klärt ist.

Matrikel

Um die Da­ten­er­fas­sung wie­der in Gang zu brin­gen ar­bei­ten wir da­ran, das Sy­stem um eine de­zen­tra­le Kom­po­nen­te zu er­wei­tern, d.h. wir schaf­fen eine Ver­sion, mit der es mög­lich wird, von einer lee­ren Post­gre­SQL Da­ten­bank aus mit der Ein­ga­be zu star­ten und die er­fass­ten Da­ten spä­ter in den Ge­samt­be­stand ein­zu­men­gen. Die­ses Ba­sis­sy­stem wird zu­sam­men mit einer Me­nge an fo­to­gra­fi­schen Auf­na­hmen auf einem Wech­sel­da­ten­trä­ger aus­ge­lie­fert. Ziel ist es, in­teres­sier­ten Drit­ten die Mög­lich­keit zu er­öf­fnen, einen Bei­trag zum Wachs­tum zu lie­fern, in­dem sie sich um die Er­fas­sung ver­dient ma­chen. Als Ge­gen­leis­tung dür­fen die­se Per­so­nen oder Or­ga­ni­sa­tio­nen den von ih­nen er­fass­ten Teil­be­stand zur ei­ge­nen Nut­zung be­hal­ten.

Projektmitarbeiter

Projektpartner