Tartalmi osztályozás számítógéppel

Sütheő Péter -Bosznay Ádám

NKÖM Informatikai Szakértők

A múzeumi nyilvántartás számítógépes megvalósítását célzó projekt kapcsán felmerült annak kérdése, hogy a nyilvántartási tételek visszakereshetőségét milyen eszközökkel lehet biztosítani. A hagyományos nyilvántartási rendszerben meglévő mutatók kiváltására javasoltuk egyes tételek indexelését, azon túlmenően pedig tárgyszavazását.

Jelen munka az információkeresés módszereinek ismertetésén keresztül bemutatja a tárgyszavazás folyamatát, a tárgyszavakkal, tárgyszó-rendszerekkel szemben támasztott követelményeket. Áttekinti, melyek azok a leltárkönyvi mezők, amelyekhez tárgyszólisták készítése javasolt.

Javaslatot tesz a három különböző típusba - személyek és intézmények, földrajzi nevek, szabadszöveges mezők tárgyszavai - sorolható tárgyszólisták, tárgyszó-rendszerek, tezauruszok felépítésére.

A gyakorlati megvalósítás lehetőségeit taglalva külön kiemeli annak lehetőségét, hogy a szabadszöveges mezők tárgyszavazásához automatikus eszközök vehetők igénybe. Az automatikus indexelés nyelvészeti módszerének ismertetése során javaslatot tesz annak múzeumi alkalmazására.

Ezen túlmenően bemutatja a tárgyszólisták kezelésének matematikai problémáit és logikai modelljét. Itt az ellentmondásokat, inkorrekt tárgyszavazásokat kiszűrő lehetőségeket ad meg, felhasználva a tárgyszavak közötti relációkat is. Ehhez a kétváltozós relációkat irányított gráfként modellezve, a feladat irányított körök, továbbá speciális tulajdonságú összefüggő részek keresésére vezethető vissza.

Végül a nyilvántartási rendszer szigorúan vett feladatán túli kitekintésként bemutatja, hogy az ily módon feldolgozott nyilvántartási tételeket hogyan lehet automatikusan osztályozni, tovább támogatva ezzel a feldolgozó és kutatómunkát.