Az SZTE Klebelsberg Könyvtár és Levéltár 2025 őszétől adatrepozitóriumi szolgáltatást nyújt az egyetem kutatóinak. Cikkünkben Dr. Nagy Gyula, a könyvtár főigazgatója és Hoczopán Szabolcs, a Tartalomszolgáltatási Osztály vezetője arról beszél: az adat mint termék önmagában is értékes lett, megtalálhatósága a publikációk hivatkozottságát, végső soron pedig az egyetem láthatóságát növeli.
Az SZTE Klebelsberg Könyvtár és Levéltár 2025 őszén elindította a Szegedi Tudományegyetem kutatási adatrepozitóriumát. A szolgáltatás célja az egyetemhez köthető kutatási adatcsomagok szakszerű tárolása, a kutatások során mért, keletkezett, felhasznált adatok elhelyezése. A hosszú távú tárolás mellett a könyvtár figyelmet fordít arra is, hogy a kutatói publikációk adatainak a lehető legjobb legyen a láthatósága; ezt metaadatok, vagyis az adatokról szóló leíró adatok rendszerével érik el, a gépi feldolgozás elősegítése érdekében pedig a FAIR kutatásiadat-kezeléshez illeszkedő elveket alkalmazzák.
Az SZTE intézményi adatrepozitórium részleteiről, jelentőségéről Dr. Nagy Gyula, az Klebelsberg Könyvtár és Levéltár főigazgatója és Hoczopán Szabolcs, a könyvtár Tartalomszolgáltatási osztályának vezetője válaszolt kérdéseinkre.
Minden minősülhet kutatási adatnak a mérések nyersanyagától a diagnosztikai eszközökön mért anonimizált jelekig, mondja Hoczopán Szabolcs. Adat lehet egy kép, például az orvosi a képalkotó eljárások kimenete, egy műszer által előállított speciális formátum vagy egy szoftverkód komponense is. A kutatási adatok keletkezhetnek egyszerű megfigyelések, műszeres kísérletek vagy számítógépes szimulációk során, esetleg származhatnak más adatforrások összehasonlításából; közös bennük, hogy tudományos publikációk esetén az eredmények reprodukálásához szükség van ezekre az eredeti adatokra.
A publikáló kutatók elemi érdeke, hogy szakcikkeik adatai megtalálhatók és beazonosíthatók legyenek. Erre a metaadatok, vagyis az adatokról szóló adatok szolgálnak, egyfajta címkék, amelyek rögzítik, hogy az adat milyen körülmények között, milyen tudományos eszközön, milyen kutatáshoz kapcsolódva keletkezett.
Az egész kutatási adatmenedzsment lényege, mondja Hoczopán Szabolcs, hogy az adatok alapján lehet reprodukálni a kutatást, felhasználni vagy összevetni az új kutatásokban keletkező adatokkal. A tudományos kiadóknál az elbíráláshoz sok esetben bekérik a nyers adatokat is, az azonban változó, hogy a kiadó saját maga kívánja-e ezeket tárolni vagy a szerzőktől várja el, hogy a repozitálásról gondoskodjanak.
Dr. Nagy Gyula elmondta, hogy a kutatói adatrepozitórium a SZTE Klebelsberg Könyvtár és Levéltár által kitűzött komplex kutatási adatmenedzsment szolgáltatás része. A terület kiemelten multidiszciplináris, az egyszerű adattároláson túl ide tartozik a metaadatok és taxonómiai besorolások rendszere, külön jártasság szükséges a fájlformátumok összetettségéhez és időbeliségéhez, és foglalkozni kell számos jogi kérdéssel is. A kutatási adatmenedzsment területen az elmúlt évtizedben új könyvtárosi szakma alakult ki, amelyet data stewardnak vagy adatgazdásznak hívnak.

Hoczopán Szabolcs és Dr. Nagy Gyula: új könyvtárosi szakma van kialakulóban. Fotó: Kovács-Jerney Ádám
Az egyetemi könyvtárban még a 2020-as évek elején mérték fel az adatok tárolására vonatkozó igényeket. Ennek során a kutatók megerősítették, hogy egyre több kutatás-finanszírozó várja el, hogy az általa finanszírozott kutatás adatai megfelelően legyenek dokumentálva.
– Azért tartjuk fontosnak, hogy a Szegedi Tudományegyetemnek önálló kutatói adatrepozitóriuma is legyen, mert így az egyetem tudományos kibocsátása egy közös helyi gyűjteményben is felmutatható – hangsúlyozta a könyvtár főigazgatója. – Az egyetemi ranglistákban is szempont, hogy az intézmény megfelelően jelen van-e a webtérben. Az SZTE intézményi adatrepozitóriuma valójában az itt előállított adatvagyon tudományos digitális lábnyoma. Növeli az egyetem láthatóságát, erősíti az adatok hivatkozottságát, és akár új együttműködéseket is tud eredményezni – mondta Dr. Nagy Gyula.
A főigazgató szerint egy kutatási adatcsomagnak nem is kell feltétlenül kapcsolódnia valamely publikációhoz. Az adat mint önálló produktum jelentőséget kapott, és egyfajta publikációként jelenik meg a webtérben. Az adatokra alapozva mára már egy második web jött létre, amelyben a kutatási adatok jelentik a találatokat. Sőt, az utóbbi években data journal-nek nevezett platformok is alakultak, amelyek csak adatokat publikálnak, minimális leíró résszel. Globálisan az ilyen adatok túlnyomó részét nem is emberek olvassák el, hanem a mesterséges intelligencia aratja. – A kutatók rendszerint úgy érzik, hogy az ő adataikat soha senki nem fogja kibogozni. Erre szoktuk mondani, hogy nem feltétlenül emberek fogják ezeket az adatokat értelmezni – mondják a könyvtári szakemberek.
A hivatkozhatóság miatt az SZTE adatrepozitóriumában található rekordok DOI azonosítóval is rendelkeznek, ami biztosítja az adatok megtalálhatóságát a tudományos műhelyek nem gépi keresése számára is. A könyvtári szakemberek szerint egyes szaklapok a publikációik mellé elvárják, hogy a hozzá kapcsolódó adatcsomag is hivatkozható módon elérhető legyen. Ennek feltöltésére több lehetőség áll a kutatók előtt: bizonyos kiadók biztosítanak saját felületet, vannak globális és interdiszciplináris adatbázisok is, mint a Zenodo, , valamint tudományterületi tárhelyek, például a CERN Open Data Portal-ja, a részecskefizika nagy repozitóriuma. Kiegészítő szintként jöttek létre az intézményi repozitóriumok, mint az SZTE szolgáltatása. Ebben a kutatási adatmenedzsment ökoszisztémában az adatokat aggregáló szolgáltatásokban kapcsolódnak össze a repozitóriumok. Hazai berkekben is folyamatban van egy föderált adatkereső kialakítása a HUN- REN Adatrepozitórium Platform keretében.
Az SZTE kutatói adatrepozitóriumba az egyetem kutatói, valamint a társszerzők, együttműködő kutatócsoportok tölthetnek fel adatcsomagokat. A korlátozással a könyvtár annak veszi elejét, hogy külső önjelölt szerzők „adatok” elhelyezésével próbáljanak esetleges áltudományos témákat hitelesíteni. A belépés regisztrációval vagy SZTE egyetemi azonosítóval lehetséges, a @szte.hu e-mail-címmel és jelszóval azonnal használatba vehető a saját fiók.
A kutatói fiókban beállítható az adatok hozzáférhetősége; e tekintetben a könyvtár azt javasolja, hogy az adatrekord és a metaadatok láthatók maradjanak. A hozzáférhetőség mottója – nyílt, amennyire lehet, zárt amennyire szükséges – azt is jelzi, hogy egyes adatok, például a betegadatok, ipari, jogi információk, szabadalmak esetén a rekord nem lehet nyíltan hozzáférhető, esetleg csak a metaadat rögzíti a létezését.
A szakma a FAIR betűszóval jelöli a kutatásiadat-kezelés gépi feldolgozásra elfogadott elveit; a FAIR jelentése: Findable (megtalálható), Accessible (hozzáférhető), Interoperable (együttműködők) és Reusable (újrafelhasználható). A tudományos adatok rohamos gyarapodása miatt ugyanis egyre inkább a gépi keresés a jellemző, a FAIR elvek pedig biztosítják, hogy a gépi rendszerek elérjék az adatokat.
Dr. Nagy Gyula arra is felhívja a figyelmet, hogy a reprodukálhatóság nemcsak a tárolás miatt kényes terület: még a feldolgozott adatok szabad hozzáférhetősége sem garantálja önmagában, hogy azok valóban helytállóak. A valóságban ugyanis a kutatási eredmények nagy arányban megismételhetetlenek. Erről szól Szabó Csaba orvosprofesszor Elpazarolt orvostudomány című könyve, amelyből egy részlet is megvilágítja a problémát: „A Nature közzétette saját anonim felmérésének eredményét. A biológia és az orvostudomány területén dolgozó válaszadók 65-75 százaléka nyilatkozta azt, hogy képtelen reprodukálni mások által közzétett adatokat, és 50-60 százalékuk azt is elismerte, hogy saját korábbi kutatási eredményeinek reprodukálásával is gondjaik vannak.”
Az SZTE Klebelsberg Könyvtár és Levéltár az RRF 2.1.2 Komplex Digitális Modellváltás – intelligens fokozatváltás projekt keretében indította el a kutatási adatok számára épített adatrepozitóriumát. Az intézmény Contenta repozitorium rendszere 2009-10-ben indult el, és jelenleg 12 intézményi repozitóriumot foglal magába.
Panek Sándor
A borítóképen: Dr. Nagy Gyula, az SZTE Klebelsberg Könyvtár és Levéltár főigazgatója és Hoczopán Szabolcs, a Tartalomszolgáltatási Osztály vezetője. Fotó: Kovács-Jerney Ádám