Keynote: Secondary use of clinical databases, real-word data and LLM at Semmelweis University - powered by Novartis
Az egészségügyi informatikai rendszerekben évtizedek óta gyűlő adatvagyon másodlagos, tehát kutatási, elemzési célú felhasználása egyre növekvő igény. Ebben nehézséget jelent az adatok heterogenitása, a nem kutatási célú adatgyűjtésből fakadó sajátosságok, a nyelvi korlátok és a standardizáció hiánya. A Semmelweis Egyetem Klinikai adattárházának létrehozása során ezekre a problémákra is keressük a megoldást az OMOP standardek követésével vagy éppen a nagy nyelvi modellek (LLM-ek) használatával a szabad szöveges dokumentációk feldolgozása során. Az elmúlt évek során ezen eszközökkel egy gyakorlatban is aktívan használt, hazai és nemzetközi együttműködésekben is helytálló rendszer jött létre. Az előadás során ezeknek az eszközökkel és módszertanokkal kapcsolatos tapasztalatinkat mutatjuk be.