Künstliche Intelligenz (KI)-Modelle wie GPT-4, bekannt für die Anwendung ChatGPT, zeigen großes Potenzial für den Einsatz in der biomedizinischen Forschung. Ein an der MedUni Wien entwickelter, auf GPT-basierender Simulator hat sich zum Beispiel bei der Klassifikation von Genen in Krebszellen als vielversprechend erwiesen.
SimulgateGPT: Auf großen Sprachmodellen basierender Simulator
Bei GPT-4 handelt es sich um ein sogenanntes großes Sprachmodell, auf Englisch als Large Language Model (LLM) bezeichnet. Derartige LLMs liefern Antworten auf Texteingaben, so genannte „Prompts“. Auf diese Weise funktioniert zum Beispiel die auf GPT-4 basierende Anwendung ChatGPT. Einfache Fragen können die Modelle meist ohne Probleme beantworten, mit komplexeren Aufgaben haben sie allerdings Schwierigkeiten. Ein Forschungsteam der MedUni Wien und des CeMM-Forschungszentrums für Molekulare Medizin hat auf Basis von GPT-4 einen Simulator für biologische Systeme konstruiert, der auf strukturierte Eingaben und gezielte Anweisungen hin vorgegebene Szenarien mit Texten nachstellt. Die Anwendung erhielt den Namen SimulgateGPT.
In der biomedizinischen Forschung kommt der Computersimulation biologischer Prozesse eine große Bedeutung zu. Die Bedienung erfordert jedoch ein großes Fachwissen und manuelle Anpassungen. Das Forschungsteam wollte herausfinden, ob sein Simulator die Anwendung vereinfachen kann und wie er im Vergleich zu direkten GPT4-Antworten abschneidet. Die Ergebnisse der Studie wurden in der heurigen August-Ausgabe des Journals „Computers in Biology and Medicin“ veröffentlicht.
Genauere Vorhersagen in verschiedenen Szenarien
Für ihre Studie haben die Forschenden SimulgateGPT in verschiedenen Szenarien eingesetzt, unter anderem bei Mausexperimenten, bei der Behandlung von Sepsis und der Vorhersage von essenziellen Genen in Krebszellen. Darüber hinaus hat das Team den Simulator Vorhersagen zum progressionsfreien Überleben von Krebspatienten treffen lassen. Die Aussagen vom SimulgateGPT wurden von Experten validiert.
Im Experiment zeigte sich, dass SimulgateGPT durchgängig bessere Ergebnisse erzielt als direkte GPT-4-Antworten. Der Simulator klassifizierte zum Beispiel die Wichtigkeit von Genen in Krebszellen tatsächlich besser als reine GPT-4-Anwendungen. Auch bei der Prognose zum progressionsfreien Überleben von Krebspatienten erzielte er genauere Ergebnisse. Zudem bevorzugten biomedizinische Experten die SimulgateGTP-Vorhersagen gegenüber direkten GPT-4-Antworten.
Weiterentwicklung LLM-basierter biomedizinischer Simulatoren
Laut Matthias Samwald, Leiter des Forschungsteams, weist die Studie auf das Potenzial von LLMs bei der Simulation biomedizinischer Szenarien hin. Textbasierte Simulatoren eignen sich seiner Ansicht nach besonders gut, um lebende Systeme nachzubilden und zu verstehen. Text und Sprache seien flexibel und interpretierbar, was notwendig sei, um die Komplexität der biomedizinischen Forschung darzustellen. Zur Weiterentwicklung der LLM-basierten biomedizinischen Simulatoren schlagen die Forscher vor, biologische Datenbanken und mathematische Modellierung zu integrieren. Außerdem sollen neue KI-Modelle mit experimentellen Daten trainiert werden.