banner
Nachrichtenzentrum
Umfangreiches Wissen in Vertrieb und Produktion

Überwachtes Deep Learning mit Vision Transformer sagt Delir mithilfe eines begrenzten Ableitungs-EEG voraus

May 30, 2023

Wissenschaftliche Berichte Band 13, Artikelnummer: 7890 (2023) Diesen Artikel zitieren

2420 Zugriffe

4 Altmetrisch

Details zu den Metriken

Bis zu 80 % der kritisch kranken Patienten entwickeln ein Delir, was die Notwendigkeit einer stationären Einweisung und eine höhere Morbidität und Mortalität erhöht. Ärzte erkennen weniger als 40 % des Delirs, wenn sie ein validiertes Screening-Tool verwenden. Das EEG ist der Kriteriumsstandard, ist jedoch ressourcenintensiv und daher für eine umfassende Delirüberwachung nicht geeignet. In dieser Studie wurde der Einsatz von Limited-Lead-Rapid-Response-EEG und überwachten Deep-Learning-Methoden mit Vision Transformer zur Vorhersage eines Delirs evaluiert. Diese Proof-of-Concept-Studie verwendete ein prospektives Design, um den Einsatz von überwachtem Deep Learning mit Vision Transformer und einem schnell reagierenden EEG-Gerät zur Vorhersage von Delir bei beatmeten kritisch kranken älteren Erwachsenen zu evaluieren. Fünfzehn verschiedene Modelle wurden analysiert. Unter Verwendung aller verfügbaren Daten lieferten die Vision-Transformer-Modelle modellübergreifend eine Trainingsgenauigkeit von über 99,9 % und eine Testgenauigkeit von 97 %. Der Sehtransformator mit schnellem EEG ist in der Lage, ein Delir vorherzusagen. Eine solche Überwachung ist bei kritisch kranken älteren Erwachsenen möglich. Daher hat diese Methode ein großes Potenzial zur Verbesserung der Genauigkeit der Delirerkennung und bietet größere Möglichkeiten für individuelle Interventionen. Ein solcher Ansatz kann die Aufenthaltsdauer im Krankenhaus verkürzen, die Entlassung nach Hause verlängern, die Sterblichkeit senken und die mit einem Delir verbundene finanzielle Belastung verringern.

Delir ist ein akutes Syndrom, das sich durch eine Veränderung der globalen kognitiven Funktion manifestiert, die entweder desorganisiertes Denken oder eine veränderte Bewusstseinsebene umfasst1. Delir tritt bei bis zu 80 % der kritisch kranken älteren Erwachsenen auf und ist mit schlechteren langfristigen kognitiven Ergebnissen verbunden2,3. Seit mehr als 20 Jahren haben mindestens 10 nationale und internationale Gesundheitsberufsorganisationen routinemäßige Delir-Screenings in die Leitlinien für die klinische Praxis aufgenommen4,5,6. Trotz dieser Empfehlungen und der Verfügbarkeit von mehr als 40 validierten Screening-Tools berichten weniger als 10 % der Ärzte, dass sie routinemäßig ein Delir-Screening durchführen4,7. Auf der Intensivstation können viele Patienten nicht am Delir-Screening teilnehmen, z. B. im Koma oder in stark sediertem Zustand, und sind daher nicht testbar. Selbst wenn diese Instrumente eingesetzt werden, bleibt das Delir schwer zu erkennen und wird daher häufig unterdiagnostiziert und unterbehandelt. Mit zunehmender Dauer und Schwere des Delirs wird die Behandlung immer schwieriger. Infolgedessen ist ein Delir mit einem einjährigen Anstieg der wirtschaftlichen Belastung um mehr als 44.000 US-Dollar pro Patient verbunden, was es zu einer globalen Krise der öffentlichen Gesundheit macht8.

Das Elektroenzephalogramm (EEG) ist ein repräsentatives Signal mit Informationen über den Zustand des Gehirns. Die Form, Amplitude und Schwingungsgeschwindigkeit der EEG-Wellenformen helfen bei der Beschreibung des Zustands und unterstützen die Diagnose, wie in Abb. 1 dargestellt. Die Verwendung des EEG zur Delirerkennung wurde erstmals in den 1940er Jahren identifiziert. Romano und Engel identifizierten eine Verlangsamung des EEG mit einer Zunahme des Schlafs und eine Abnahme der Wachwellen, wenn ein Delir vorlag9,10. So konnte ein Delir durch die Untersuchung von Veränderungen der Nervenaktivität mittels EEG zuverlässig identifiziert werden. Leider haben die erheblichen Kosten, die mit der technologischen Einrichtung verbunden sind, und die Notwendigkeit einer Expertenanalyse den Einsatz des EEG zur Delirerkennung im klinischen Umfeld verhindert11,12.

Unsere funktionierende Pipeline.

Schritt 1: Extrahieren Sie Teilmengen aus den Daten. Jede Teilmenge hat einen Datensatz von t Sekunden. Teilen Sie diese Teilmengen in Trainings-/Testsätze auf.

Schritt 2 Teilmengen in „Bilder“ (*) umwandeln.

Schritt 3 Verwenden Sie diese „Bilder“, um das ViT-Modell zu füttern.

In jüngerer Zeit sind benutzerfreundliche Hand-EEG-Geräte erhältlich, deren Aufzeichnungsgenauigkeit dem herkömmlichen EEG entspricht und die mit schnellen Analysemethoden wie maschinellem Lernen programmiert sind13. Diese Geräte ermöglichen eine schnelle Einrichtung durch Personen mit begrenzter Schulung und liefern so schnelle EEG-Daten (und damit ein schnelles Reaktions-EEG) innerhalb von Minuten, im Gegensatz zu herkömmlichen EEG-Geräten, deren Einrichtung bis zu einer Stunde dauern kann und speziell geschultes Personal erfordert. Zur Auswertung von EEG-Wellenformen werden Signalparameter extrahiert und mithilfe computergestützter statistischer Algorithmen analysiert. Beispielsweise bietet die nichtlineare Zeitreihenanalyse Einblicke in die dynamische Natur und Variabilität von Gehirnsignalen14. Mit der Entwicklung eines Algorithmus, der eine genaue prädiktive Erkennung ermöglicht, könnten neuere EEG-Geräte eine praktikable physiologische Methode zur Unterstützung von Ärzten bei der Delirerkennung darstellen.

Die in der aktuellen Forschung und Praxis am weitesten verbreitete Technik des maschinellen Lernens ist das überwachte maschinelle Lernen, bei dem die Grundwahrheit den Forschern bekannt ist und im Trainingsdatensatz gekennzeichnet ist. Ausgefeilte tiefe neuronale Netze werden häufig übernommen und optimiert, um den Anforderungen spezifischer Lernaufgaben in realen Szenarien gerecht zu werden. Während der Deep-Learning-basierte Ansatz die herkömmlichen statistischen Algorithmen für maschinelles Lernen hinsichtlich der Vorhersagegenauigkeit oft übertrifft, macht die Blackbox-Natur des Modells die Verwendung im medizinischen Bereich oft unpraktisch. Oft sind zusätzliche Module erforderlich, um zu erklären, warum oder wie die Entscheidung durch die Deep-Learning-Algorithmen getroffen wurde.

Das in dieser Studie verwendete überwachte Deep-Learning-Modell war Vision Transformer (ViT)15,16,17. Das ViT-Modell nutzte die hochmoderne Transformer-Architektur, die den Bereich der Verarbeitung natürlicher Sprache (NLP) revolutioniert hat. Es ist zu beachten, dass EEG-Daten typischerweise sequentieller Natur sind. Daher wurden in der Literatur häufig sequentielle Modelle wie BERT18 und Fractional Dynamics Foster Deep Learning angewendet. Allerdings umfassen EEG-Daten im Tabellenformat eine Kombination von Wellen mit unterschiedlichen Frequenzen, was die herkömmlichen sequentiellen Ansätze weniger effektiv macht19. Die EEG-Daten im Wellenbildformat enthalten sowohl zeitliche Daten als auch visuelle Muster. Aufgrund seiner herausragenden Leistung bei Computer-Vision-bezogenen Problemen wurde ViT in jüngsten Bildklassifizierungsaufgaben eingesetzt und es wurden Leistungsverbesserungen gegenüber herkömmlichen CNN-basierten Frameworks festgestellt20. In dieser Arbeit untersuchen wir, wie ViT genutzt werden kann, um aus EEG-Daten Erkenntnisse zu gewinnen. Wir zeigen, dass die Anwendung von ViT im Wellenbildformat im Zeitbereich viel besser ist als die Anwendung von ViT im Frequenzbereich.

Damit das Transformationsmodell für Bildklassifizierungsaufgaben funktioniert, besteht die Kernidee darin, ein Bild in eine Matrix von \(n \times n\) Teilbildern zu zerlegen. Diese Teilbilder werden dann als sequentielle Daten behandelt, sodass der Selbstaufmerksamkeitsmechanismus angewendet werden kann, um die Beziehung zwischen Paaren von Teilbildern zu messen. Der Vorteil von ViT ist die Fähigkeit, sowohl räumliche als auch zeitliche Informationen zu verwalten. EEG-Daten sind sequentiell und haben eine räumliche Beziehung, was das ViT zu einem idealen Modell für diese Analyse macht. In diesem Artikel wird beschrieben, wie maschinelles Lernen mit Vision Transformer als elektronisches Mittel zur Delirerkennung bei minimalem Risiko und geringen Kosten dienen kann.

Dies ist die erste prospektive Proof-of-Concept-Pilotstudie mit einem schnell reagierenden EEG-Gerät, das Daten aus allen Hirnlappen liefert, und einer überwachten Deep-Learning-Methode (Vision Transformer) zur Bewertung des EEG auf das Vorliegen eines Delirs bei kritisch kranken Patienten.

Die Studie (UMCIRB 17-001900 MIND) wurde am 13. März 2018 vom East Carolina and Vidant Medical Center Institutional Review Board (UMCIRB) geprüft und genehmigt. Vor Beginn jeglicher Forschungsaktivitäten wurde eine schriftliche Einverständniserklärung des gesetzlich bevollmächtigten Vertreters des Teilnehmers eingeholt. Alle Forschungsverfahren wurden in Übereinstimmung mit den ethischen Standards des UMCIRB IRB und der Helsinki-Erklärung von 1975 durchgeführt.

Das Protokoll für diese Studie wurde zuvor in RINAH21 veröffentlicht. Kurz gesagt: Patienten, die die Einschluss- und Ausschlusskriterien erfüllten, wurden zwischen März 2019 und März 2020 auf drei Intensivstationen (kardiologische, medizinische und chirurgische Intensivstation) in einem großen ländlichen akademischen medizinischen Zentrum in North Carolina rekrutiert. Alle Teilnehmer waren mindestens 50 Jahre alt und eine mechanische Beatmung für mehr als 12 Stunden benötigten, die Englisch sprachen und für die eine schriftliche Einverständniserklärung des gesetzlich bevollmächtigten Vertreters eingeholt wurde. Zu den Ausschlusskriterien gehörten eine akute Hirnverletzung, Krampfanfälle oder ein Zustand, der die Teilnahme am Delir-Screening verhinderte. Die Einwilligung wurde vor der Einschreibung vom gesetzlich bevollmächtigten Vertreter eingeholt, da die Teilnehmer nicht in der Lage waren, selbst zuzustimmen.

Jeden Tag wurde die Fähigkeit des Patienten zur Teilnahme an einem Delir-Screening anhand der Richmond Agitation Sedation Scale (RASS)22,23 beurteilt. Der RASS ist eine 10-stufige Skala (+ 4 „kämpferisch“ bis − 5 „unaufhaltsam“) mit ausgezeichneter Interrater-Zuverlässigkeit (r = 0,956, untere 90 %-Konfidenzgrenze = 0,948; κ = 0,73, 95 %-Konfidenzintervall = 0,71, 0,75)22,23. Ein RASS-Wert von −2 oder höher (in der Lage, die Augen für mehr als 10 Sekunden zu öffnen, um zu sprechen) erfüllte die Eignung.

Demografische und klinische Merkmale wurden aus der elektronischen Krankenakte (EMR) ermittelt.

Die Confusion Assessment Method for the Intensive Care Unit (CAM-ICU) ist eine modifizierte Version der CAM, die zur Beurteilung mechanisch beatmeter und nonverbaler Patienten auf der Intensivstation24,25 entwickelt wurde. Das CAM-ICU basiert auf dem Goldstandard zur Delirerkennung, dem Diagnostic and Statistical Manual for Mental Disorder IV (DSM-IV) und einem von zwei Delir-Screening-Tools, die von der Society of Critical Care Medicine (SCCM)1 zur Verwendung empfohlen werden. 4,26. Die CAM-ICU erfordert die Beteiligung des Patienten, um vier Schlüsselmerkmale des Delirs zu identifizieren, darunter (a) akuter Beginn oder Schwankung des Geisteszustands innerhalb der letzten 24 Stunden, (b) Unaufmerksamkeit, (c) verändertes Bewusstseinsniveau [Richmond Agitation Sedation Scale (RASS) ≠ 0] und (d) desorganisiertes Denken24,25. Beim Einsatz in der Forschung weist die CAM-ICU eine hohe Sensitivität und Spezifität von 93 bzw. 98 % sowie eine hohe Interrater-Zuverlässigkeit von k.0,79 auf.

Jedem Teilnehmer wurden täglich Schnell-EEG-Stirnbänder angelegt, die den Kopf umschließen. Die Genauigkeit der Platzierung basiert auf der Position der Kopfbandbefestigung in der Mitte der Stirn, die Elektroden sind mit 1–10 nummeriert, das Kopfband wird am Haaransatz am Hinterkopf mit dem Rekorder verbunden, EEG-Wellenformen werden sofort auf dem EEG-Rekorder visualisiert und Der Rekorder identifiziert die Qualität der Verbindung (z. B. Impedanz) anhand eines farbcodierten Diagramms (grün = niedrige Impedanz/rot = hohe Impedanz) des Kopfbands. Die EEG-Überwachung erfolgte 2 Stunden lang jeden Abend zwischen 17:00 und 21:00 Uhr (17:00–21:00 Uhr) über einen Zeitraum von vier Tagen oder bei Entlassung auf die Intensivstation. Nach einer Stunde EEG-Überwachung wurde der Teilnehmer vom Forschungsteam mithilfe der Confusion Assessment Method for the ICU (CAM-ICU) auf Delir untersucht. Um mit dem CAM-ICU als Delir-positiv zu gelten, muss der Teilnehmer mindestens drei der Kernkomponenten des Delirs aufweisen, einschließlich einer akuten Veränderung des mentalen Ausgangszustands, Unaufmerksamkeit zeigen und entweder einen veränderten Bewusstseinsgrad oder desorganisiertes Denken haben.

Vor der Analyse wurden EEG-Daten verarbeitet, um Artefakte wie Muskelbewegungen im Gesicht und Störungen durch in der Nähe befindliche Geräte wie Beatmungsgeräte und Herzmonitore zu entfernen. Dazu werden hohe und tiefe Frequenzen mithilfe von Filtern entfernt. Die Daten werden dann erneut referenziert, um das physiologische Rauschen abzuschätzen, und in mehrere diskrete Zeiträume, sogenannte Epochen, unterteilt. Nach der Vorverarbeitung werden die EEG-Daten mithilfe der Einzelkomponentenanalyse (IDA) weiter „bereinigt“, um Rauschen zu entfernen und Funktionen zu generieren, die für Algorithmen für maschinelles Lernen erforderlich sind. Die Komponentenanalyse ist eine weithin akzeptierte Methode zur Datenbereinigung durch Trennung von Artefakten aus Daten, die aus kortikalen Prozessen stammen14,27. Der Vorteil der Analyse unabhängiger Komponenten mit Statistiken höherer Ordnung besteht in der Möglichkeit, Artefakte einfach durch direkte Untersuchung der unabhängigen Komponenten der Daten zu subtrahieren.

Die EEG-Analysetechniken waren in den verschiedenen Studien unterschiedlich. Daher wurden zunächst sowohl traditionelle als auch drei Methoden des maschinellen Lernens zur Analyse dieser Daten verwendet, insbesondere Random Forest (Reihe von Entscheidungsbäumen) und schrittweise lineare Diskriminanzanalyse (entfernt Variablen, die nicht zur Klassifizierung der Daten beitragen, in diesem Fall Delirium−/Delirium+). und Support-Vektor-Maschine (Computer erstellt ein Modell, um den größten Unterschied zwischen den Kategorien bereitzustellen, in diesem Fall Delirium−/Delirium+). Aufgrund der Herausforderungen bei der Funktionsauswahl wurde in dieser Analyse hauptsächlich eine überwachte Deep-Learning-Methode, nämlich Vision Transformer, verwendet. Bei vielen Deep-Learning-Anwendungen ist zu beobachten, dass ausgefeilte Datenverarbeitungstechniken und Feature-Engineering oft nicht erforderlich sind, da die tiefen neuronalen Netze diese subtilen Features direkt aus den Eingabedaten lernen können. Daher wurden zwei Arten von Daten untersucht. Die erste Art von Eingabedaten wurde vorverarbeitet (Muskelbewegung und Beseitigung von Geräteinterferenzen) und IDA bereinigt, während die zweite Art von Eingaben nur einer Vorverarbeitung ohne IDA-Bereinigung unterzogen wurde. Die Daten wurden alle 4 ms von den EEG-Geräten extrahiert und jede Datenprobe enthält die Messwerte von acht Sensoren.

Eine fortlaufende Anzahl von Datenzeilen wird in einem Datenausschnitt organisiert, der ein \(8 \times n\)-Array ist, wobei \(n\) die Anzahl der Zeilen darstellt. Die Größe dieser Arrays wird mithilfe der bilinearen Interpolation auf \(224 \times 224\) geändert und als Bilder behandelt, die in das ViT-Modell eingespeist werden, wie in Abb. 2 dargestellt.

Die Verwirrungsmatrix für das Experiment.

Unser Hauptziel bestand darin, den Frequenzbereich innerhalb der Wellenbilder zu identifizieren, der den größten Einfluss auf die Klassifizierungsergebnisse hat. Wir gehen davon aus, dass, wenn ein Bildsegment keinen vollständigen Wellenzyklus einer bestimmten Frequenz enthält, der Effekt dieser Frequenz wahrscheinlich keine signifikante Auswirkung auf die Klassifizierungsergebnisse hat. Durch die Steuerung der Länge der Datenscheiben kann der Frequenzbereich gesteuert werden, den das Bild umfassen wird. Wenn beispielsweise \(n = 25\), dann beträgt die Zeitspanne dieses Wellenbildes \(0,1s\) und die entsprechende Frequenz ist \(f > 10\,\text{Hz}\). Kurz gesagt, \(n\) bestimmt die niedrigste Frequenz, die ein Bild enthalten würde. Um den Einfluss von Teilfrequenzen in verschiedenen Phasen zu untersuchen und die Datengröße zu erhöhen, haben wir die Wellenbilder in überlappende Segmente unterteilt. Eine solche Behandlung kann das Verhältnis von Wellen mit unterschiedlichen Frequenzen besser widerspiegeln.

Um zu verstehen, wie die Ergebnisse mit der Größe der Scheiben zusammenhängen, wurden fünf verschiedene Längen gewählt: fünfundzwanzig Reihen (0,1 s), 125 Reihen (0,5 s), 250 Reihen (1 s), 400 Reihen (1,6 s), und 1250 Reihen (5 s). Aufgrund der geringen Populationsgröße werden die Daten mithilfe eines überlappenden Fensterschemas erweitert, bei dem die Startzeile des nächsten Datenausschnitts irgendwo im aktuellen Datenausschnitt und nicht nach der letzten Zeile des aktuellen Datenausschnitts gefunden wird. Ein Beispiel für einen 30 % überlappenden Datenausschnitt von einer Sekunde (250 Zeilen) ist in Abb. 3 dargestellt. Zu den relevanten Signalen in der EEG-Studie gehören Alpha (8–12 Hz), Beta (15–30 Hz), Delta (0,5–3). Hz), Gamma- (> 30 Hz) und Theta-Wellen (4–7 Hz). Wenn wir \(T\) verwenden, um die Zeitspanne jedes Datenabschnitts darzustellen, dann ist die Häufigkeit, die ein Bild erkennen kann, \(f = \frac{1}{T}\). In der Studie ist die höchste minimale Frequenz, die es erkennen kann, \(10\,\,\text{Hz}\), wenn \(T = 0,1s\), und die niedrigste minimale Frequenz, die es erkennen kann, ist \(0,2\, \,\text{Hz}\), wenn \(T = 5s\). Die Datenabschnitte werden nach dem Zufallsprinzip in Test- und Trainingssätze aufgeteilt, wobei vermieden wird, alle Daten eines Probanden in einem Satz (Training + Test) zusammenzufassen. Positive und negative Fälle sind sowohl in den Trainingssätzen als auch in den Testsätzen relativ ausgeglichen, mit einem Verhältnis nahe eins.

Arbeitspipeline für Modelle, die im Vergleichsexperiment im Frequenzbereich trainiert wurden.

In dieser Studie wurden die Standard-Hyperparameter des Modells verwendet: Stapelgröße = 64, Lernrate = 0,001, Tiefe = 12 und Köpfe = 8. Es wurden Überlappungsverhältnisse von 75 %, 90 % und 95 % untersucht. Da zwischen diesen unterschiedlichen Überlappungsverhältnissen keine größeren Unterschiede festgestellt wurden, wurde zur Darstellung der Ergebnisse ein Fensterüberlappungsverhältnis von 90 % verwendet. Bei Verwendung des ViT-Modells konvergieren die EGG-Daten sehr schnell. In den meisten Situationen erreichte die Trainingsgenauigkeit in nur drei Epochen mehr als 99 %. Um eine Überanpassung zu vermeiden, wurden nach 5 Epochen trainierte Modelle zur Auswertung der Testdatensätze verwendet.

Der Grund für die Verwendung von ViT, einem transformatorbasierten CV-Modell, anstelle eines transformatorbasierten Sprachmodells, besteht darin, dass die Daten eine Mischung aus Wellen unterschiedlicher Frequenz sind. Da sich die Wellen periodisch wiederholen, liefert ein Bildsegment, das mindestens einen vollständigen Zyklus einer bestimmten Frequenz enthält, möglicherweise nicht genügend Informationen für die Analyse seiner Daten. Diese Studie untersuchte Bildsegmente, die eine Ansammlung von Wellen mit unterschiedlichen Frequenzen enthalten. Da EEG-Daten am besten im Wellenbildformat dargestellt werden, ist das Transformer-basierte NLP-Modell nicht das am besten geeignete Modell zur Analyse von EEG-Wellenbildern. Aus diesem Grund haben wir uns entschieden, ViT anstelle von Transformer zur Analyse der Daten zu verwenden.

Beachten Sie auch, dass es gängige Praxis ist, Zeitreihendaten mithilfe von Transformationstechniken wie der schnellen Fourier-Transformation (FFT) in Spektralbilder zu übertragen. Wir argumentieren, dass eine solche Transformation für das ViT-Modell nicht gut geeignet ist. In dieser Arbeit haben wir auch die Auswirkung der Hinzufügung von FFT zum Prozess untersucht. Der Arbeitsablauf ist in Abb. 3 dargestellt.

Um den Wert des ViT-Modells bei EEG-Datenanalysen besser zu verstehen, wurde auch ein öffentlicher Datensatz28 zur Durchführung einer binären Klassifizierungsaufgabe verwendet. Der Datenausschnitt von 1250 Zeilen wurde übernommen und das Überlappungsverhältnis auf 90 % festgelegt. Das Modell erreichte eine Testgenauigkeit von 86,33 %, was besser ist als die hochmodernen Algorithmen SleepEEGNet mit einer Genauigkeit von 80,03 %. Die Pilotergebnisse zeigen, dass ViT besser zur Analyse von EEG-Daten geeignet ist als bestehende Algorithmen.

Fünfzehn verschiedene Behandlungen (5 Datenscheibengrößen \(\times\) 3 Überlappungsrate) wurden verwendet, um die Leistung des ViT-Modells zu bewerten. Da sich die Überlappungsraten nicht auf die Genauigkeitsergebnisse auswirkten, wurden nur Befunde mit einer Überlappungsrate von 90 % gemeldet, siehe Tabelle 1.

Das Modell erreichte die beste Testgenauigkeit von 97,58 %, wenn das Datensegment eine Größe von 1250 Zeilen (5 s) hat. Abbildung 4 veranschaulicht den Einfluss von Datensegmenten auf die Vorhersagegenauigkeit.

Die Verwirrungsmatrix für das Vergleichsexperiment, wobei der linke Teil die Matrix für das im Frequenzbereich trainierte Modell und der rechte Teil die Matrix für das im Zeitbereich trainierte Modell zeigt.

Wenn das Datensegment nur fünfundzwanzig Zeilen umfasst, enthält es vollständige Wellenzyklen, die höher als \(10\;{\text{Hz}}\ sind). Die Vorhersagegenauigkeit betrug lediglich 51,86 %, was darauf hindeutet, dass das ViT aus den Daten nichts Nützliches gelernt hat. Die schlechten Ergebnisse könnten darauf hindeuten, dass Wellen mit höheren Frequenzen für die Vorhersage eines Delirs weniger wichtig sind. Dies könnte auch daran liegen, dass die Größe der Datenfolien zu klein war, um sie auf \(224 \times 224\) Bilder zu ändern. Wenn ein Datenausschnitt mindestens einen vollständigen Zyklus von \(2 \;{\text{Hz}}\) Wellen (0,5 s oder 125 Zeilen) enthält, erhöht sich die Genauigkeit auf 72,82 %. Wenn ein Datenausschnitt mindestens einen vollständigen Zyklus von \(1 \;{\text{Hz}}\) Wellen (1 s oder 250 Zeilen) enthält, erhöht sich die Genauigkeit weiter auf etwa 95 %. Bessere Ergebnisse werden mit Wellen mit niedrigerer Frequenz erzielt. Weitere Untersuchungen sind erforderlich, um vollständig zu verstehen, ob Langwellensignale wie Deltawellen wirklich die Prädiktoren für Delir sind. In den meisten Experimenten konvergierten die Modelle in drei Epochen. Die Genauigkeiten verbesserten sich von Epoche sechs bis Epoche zehn nicht.

Um die Ergebnisse der Analyse von EEG-Daten im Frequenzbereich zu untersuchen, verglichen wir die Verwirrungsmatrix mit den Daten im Zeitbereich. Die Experimentparameter waren \(t = 5s\), \(overlapping\; Rate = 50\%\) und die Epochen wurden auf 4 eingestellt. Abbildung 4 zeigt die Ergebnisse dieser Kontraststudie. Es zeigt, dass die Leistung des Modells im Zeitbereich seine Leistung im Frequenzbereich übertrifft. Diese Ergebnisse stimmen mit unserer Diskussion überein und unterstützen die Wirksamkeit unseres Ansatzes zur Merkmalsextraktion in Bezug auf die Domäne und die Auswahl des ViT-Modells zur Analyse von EEG-Daten im Wellenbildformat.

Da ViT bei mit IDA bereinigten Daten gut funktioniert hat, stellt sich die Frage: Würde ViT gute Vorhersageergebnisse für Datensätze liefern, die nicht mit IDA bereinigt wurden? Um diese Frage zu beantworten, wurden dem ViT-Modell auch ungereinigte Daten zugeführt, um die Ergebnisse auszuwerten. Es wurden 1250 Datenscheiben mit einer Überlappungsrate von 90 % ausgewählt. Zu unserer Überraschung erreichten sowohl die Trainings- als auch die Testgenauigkeiten mehr als 99,99 %. Dies könnte darauf hindeuten, dass Deep-Learning-Techniken wie ViT wahrscheinlich keine zusätzlichen Feature-Engineering-Techniken benötigen, um beeindruckende Ergebnisse zu erzielen. Da der Datensatz klein ist, ist es zu früh, eine solche Behauptung aufzustellen. Zur Validierung dieser Hypothese sind weitere Studien erforderlich.

Die von den Forschern gesammelten Datensätze waren auf nur zwölf Probanden beschränkt und wurden nur für Delir-Vorhersagen verwendet. Was ist mit anderen EEG-Datensätzen? Wir haben ein weiteres Experiment durchgeführt, um herauszufinden, ob ViT noch anwendbar ist. Wir haben ViT auch in einem öffentlichen EEG-Datensatz28 angewendet, um eine binäre Klassifizierungsaufgabe durchzuführen. Bei einer Windows-Größe von 1250 Punkten erreichte das Modell eine Testgenauigkeit von 86,33 %.

Dies ist die erste prospektive Pilotstudie, bei der ein 10-Elektroden-EEG-Gerät mit schneller Reaktion verwendet wird, das Daten aus allen Lappen des Großhirns, überwachtes Deep Learning und ViT liefert, um das EEG auf das Vorhandensein eines Delirs zu untersuchen. Dieses Pilotprojekt ergab, dass eine solche Überwachung bei kritisch kranken älteren Erwachsenen auf medizinischen, chirurgischen und kardiologischen Intensivstationen möglich ist. Das wichtigste Ergebnis ist, dass mithilfe von überwachtem Deep Learning und einer ViT-Plattform Patienten anhand identifizierbarer Merkmale im EEG genau als Delir-positiv oder Delir-negativ klassifiziert wurden, wodurch das Vorliegen eines Delirs vorhergesagt wurde. Diese Ergebnisse wurden mit drei Methoden des maschinellen Lernens repliziert. Zu den Methoden des überwachten Lernens gehörten die schrittweise lineare Diskriminanzanalyse und Support-Vektor-Maschinen, und überwachtes Deep Learning wurde mit ViT durchgeführt. Im Vergleich zu früheren Studien, die verschiedene Methoden des maschinellen Lernens und der Vorverarbeitung verwendeten, lieferte das ViT-Modell mit den oben genannten Hyperparametern eine höhere Genauigkeit. Beispielsweise verwendeten van Sleuwen und Sun29 ein 3-Kanal-Gerät mit begrenzter Ableitung, um physiologische Methoden mithilfe des Confusion Assessment Method-Severity Score zu messen. Um drei Kanäle oder Wellenformen zu erhalten, verwendeten sie 6-s-EEG-Streifen, die aus einer 4-Elektroden-Frontmontage gewonnen wurden. Mithilfe dieser Montage an 252 deliranten und 121 nicht deliranten Patienten erhielten sie Genauigkeiten von 0,63–0,73 auf der ROC-Kurve, was bedeutet, dass das Modell 63–70 % der echten positiven Ergebnisse für jede mögliche Entscheidungsschwelle des Modells genau vorhersagte. In ähnlicher Weise konnten Yamanashi und Kajitani30 mithilfe eines bispektralen EEG mit zwei Kanälen AUCs von 63–76 % erzielen. Daher empfahlen sie, dass weitere Studien von Deep-Learning-Modellen wie dem in dieser Pilotstudie verwendeten profitieren könnten.

Der Vorteil dieses tragbaren Schnellreaktions-EEG liegt in seiner Objektivität im Vergleich zu derzeit verfügbaren Screening-Methoden am Krankenbett. Darüber hinaus erfordert diese Methode nicht den Einsatz eines großen EEG-Geräts und spezialisierter Techniker für die Elektrodenplatzierung, was häufig ein großvolumiges Massenscreening einschränkt, wie es zum Screening auf Delir auf Intensivstationen erforderlich ist. Das Rapid-Response-EEG ist für vielbeschäftigtes Krankenhauspersonal mit minimaler Schulung einfach zu bedienen. Durch die Verwendung vorprogrammierter Algorithmen wie dem hier beschriebenen wird der Bedarf an fachmännischer Interpretation, die bei der Verwendung des herkömmlichen EEG erforderlich ist, begrenzt. Daher ist diese Erkennungsmethode nicht durch Subjektivität und Rationalisierung der Ergebnisse im Zusammenhang mit dem Screening am Krankenbett eingeschränkt.

Obwohl das oben verwendete ViT-Modell eine zufriedenstellende Leistung aufweist, gibt es dennoch Möglichkeiten zur Verbesserung der Vorhersage. Beispielsweise hätte die Verwendung eines Fensters von 10–60 s anstelle der 1–5 s-Fenster, die normalerweise bei dieser Art von Analyse verwendet werden, möglicherweise mehr Datenpunkte geliefert. Während der Vorverarbeitungsphase verwendete unsere Studie Sequenzextraktion, was bedeutet, dass Proben in chronologischer Reihenfolge und endlicher Länge erhalten werden. Es ist möglich, dass eine ständige Korrektur oder Interpolation (Entfernen von fehlerhaften Daten aus der Ableitungselektrode) einen saubereren Datensatz für die Analyse liefert.

Zu den Einschränkungen dieser Studie gehört die kleine Stichprobe von dreizehn Teilnehmern, von denen sieben während des vom CAM-ICU ermittelten Überwachungszeitraums ein Delir erlebten. EEG-Veränderungen treten vor dem Einsetzen der Symptome auf und daher wurde bei einigen Teilnehmern möglicherweise ein subsyndromales Delir mithilfe des EEG festgestellt, das beim Screening am Krankenbett (CAM-ICU) nicht erkannt wurde. Die Beurteilung des Delirs erfolgte durch den Forscher und nicht durch die Beurteilung durch den Arzt, was eine höhere Zuverlässigkeit des Delirstatus ermöglichte. Die Heterogenität der Stichprobe mit unterschiedlichen Ätiologien und Medikamentenexpositionen könnte dazu geführt haben, dass sich einige EEG-Veränderungen bei einer Untergruppe von Patienten stärker widerspiegelten als andere, wodurch die Generalisierbarkeit minimiert wurde. Obwohl diese Studie Einschränkungen aufweist, wurden bei allen Analysemethoden (Häufigkeitsverhältnisse, überwachtes Lernen und Deep Learning) konsistente Ergebnisse erzielt, was die Ergebnisse untermauert.

In dieser Analyse haben wir ein ViT-Modell trainiert, um EEG-Daten unter der Einschränkung einer kleinen Stichprobe und damit einer begrenzten Datenmenge zu analysieren. Trotz der Verwendung einer Sequenzextraktionsmethode zur Vorverarbeitung ist die Genauigkeit von 97 % deutlich besser als die ca. 40 % Genauigkeit der von Ärzten abgeleiteten CAM-ICU-Bewertungen. Daher hat diese Methode ein großes Potenzial zur Verbesserung der Genauigkeit der Delir-Erkennung und bietet größere Möglichkeiten zur Implementierung und Bewertung individueller Interventionen. Sobald eine frühzeitige Erkennung von Hirnfunktionsstörungen, die mit schlechten Ergebnissen wie der Notwendigkeit einer Heimeinweisung und einer höheren Sterblichkeit einhergehen, leicht möglich ist, wird es möglich sein, reversible Ursachen zu identifizieren und anschließend frühzeitig einzugreifen und engmaschig zu überwachen, um vermeidbare Komplikationen zu vermeiden. Eine physiologische Methode zur Delir-Erkennung kann die Möglichkeit bieten, Interventionen durchzuführen, wenn das Delir besser behandelbar ist. Ein früherer Eingriff kann die Dauer des Krankenhausaufenthalts verkürzen, die Chance eines Patienten erhöhen, nach der Entlassung aus dem Krankenhaus nach Hause zu gehen, die Sterblichkeitsrate senken und die finanziellen Kosten senken Belastung im Zusammenhang mit Delir.

Die im Rahmen der aktuellen Studie generierten und/oder analysierten Datensätze sind nicht öffentlich verfügbar, können aber auf begründete Anfrage beim entsprechenden Autor angefordert werden.

Amerikanische Psychiatrie-Vereinigung. Diagnostisches und statistisches Handbuch für psychische Störungen: DSM-5 (American Psychiatric Association, 2013).

Buchen Sie Google Scholar

Bashar, FR et al. Psychische Morbidität nach der Intensivstation bei Patienten mit ARDS und Delir, die sich sehr lange auf der Intensivstation aufhalten. J. Krit. Care 43, 88–94 (2018).

Artikel PubMed Google Scholar

Mulkey, MA et al. Pathophysiologische Übersicht: Sieben Neurotransmitter im Zusammenhang mit Delir. Klin. Krankenschwester Spec. 32(4), 195–211 (2018).

Artikel PubMed Google Scholar

Devlin, JW et al. Leitlinien für die klinische Praxis zur Vorbeugung und Behandlung von Schmerzen, Unruhe/Sedierung, Delirium, Immobilität und Schlafstörungen bei erwachsenen Patienten auf der Intensivstation. Krit. Pflege Med. 46(9), e825–e873 (2018).

Artikel PubMed Google Scholar

National Institute for Health and Care Excellence: Klinische Leitlinien zur Rehabilitation von Erwachsenen mit komplexer Psychose. 2020, National Institute for Health and Care Excellence (UK) Copyright © NICE 2020.: London.

Amerikanische Geriatrische Gesellschaft. Die American Geriatrics Society hat eine klinische Praxisleitlinie für postoperatives Delir bei älteren Erwachsenen zusammengefasst. Marmelade. Geriatr. Soc. 63(1), 142–150 (2015).

Artikel Google Scholar

Hunter, A. et al. Delir-Screening auf der Intensivstation mit neuen QEEG-Techniken: Eine Pilotstudie. ZIELE Neurowissenschaften. 7(1), 1–16 (2020).

Artikel PubMed PubMed Central Google Scholar

Gou, RY et al. Einjährige medizinische Kosten im Zusammenhang mit Delir bei älteren Patienten, die sich einer größeren elektiven Operation unterziehen. JAMA Surg. 156, 430–442 (2021).

Artikel PubMed Google Scholar

Engel, GL & Romano, J. Delirium: Ii. Reversibilität des Elektroenzephalogramms mit experimentellen Verfahren. Bogen. Neurol. Psychiatrie 51(4), 378–392 (1944).

Artikel Google Scholar

Romano, J. & Engel, GL Delirium: I. elektroenzephalographische Daten. Bogen. Neurol. Psychiatrie 51(4), 356–377 (1944).

Artikel Google Scholar

van der Kooi, AW et al. Delirerkennung mittels EEG: Was und wie man misst. Truhe 147(1), 94–101 (2015).

Artikel PubMed Google Scholar

Mulkey, MA et al. Das schnelle tragbare kontinuierliche Elektroenzephalogramm (EEG) hat das Potenzial, ein Delir bei älteren Erwachsenen zu erkennen. Abmessungen. Krit. Pflegekräfte. 41(1), 29–35 (2022).

Artikel PubMed PubMed Central Google Scholar

Kamousi, B. et al. Vergleich der Qualität der mit einem Schnellreaktions-EEG und herkömmlichen klinischen EEG-Systemen aufgezeichneten Signale. Klin. Neurophysiol. Üben. 4, 69–75 (2019).

Artikel PubMed PubMed Central Google Scholar

Kannathal, N. et al. Charakterisierung des EEG – Eine vergleichende Studie. Berechnen. Methodenprogramme Biomed. 80(1), 17–23 (2005).

Artikel CAS PubMed Google Scholar

Dosovitskiy, A., et al., Ein Bild sagt mehr als 16x16 Worte: Transformatoren für die Bilderkennung im Maßstab. arXiv-Vorabdruck arXiv:2010.11929, 2020.

Vaswani, A., et al. Aufmerksamkeit ist alles, was Sie brauchen. In Fortschritte in neuronalen Informationsverarbeitungssystemen. 2017.

Kostas, D., Aroca-Ouellette, S. & Rudzicz, F. BENDR: Verwendung von Transformatoren und einer kontrastiven selbstüberwachten Lernaufgabe, um aus riesigen Mengen an EEG-Daten zu lernen. Vorderseite. Summen. Neurosci. 15, 653659 (2021).

Artikel PubMed PubMed Central Google Scholar

Acheampong, FA, Nunoo-Mensah, H. & Chen, W. Transformer-Modelle zur textbasierten Emotionserkennung: Ein Überblick über BERT-basierte Ansätze. Artif. Intel. Rev. 54(8), 5789–5829 (2021).

Artikel Google Scholar

Yin, C. et al. Die fraktionierte Dynamik fördert das tiefgreifende Lernen der Vorhersage des COPD-Stadiums. Adv. Wissenschaft. 10, 2203485 (2023).

Artikel Google Scholar

Xue, F. et al. Vision Transformer mit aufmerksamem Pooling für eine robuste Gesichtsausdruckserkennung. IEEE Trans. Beeinflussen. Berechnen. (2022).

Mulkey, MA et al. Methoden zur Identifizierung von Delir: Ein Forschungsprotokoll. Res. Krankenschwestern. Gesundheit 42(4), 246–255 (2019).

Artikel PubMed Google Scholar

Sessler, CN et al. Die Richmond Agitation-Sedation Scale: Validität und Zuverlässigkeit bei erwachsenen Patienten auf der Intensivstation. Bin. J. Atmung. Krit. Pflege Med. 166(10), 1338–1344 (2002).

Artikel PubMed Google Scholar

Sessler, CN et al. Gültigkeit und Zuverlässigkeit einer neuen Agitations-Sedierungsskala in einer medizinischen Intensivstationspopulation. Truhe 118 (Beilage 4), 95S (2000).

Google Scholar

Ely, EW et al. Delir bei beatmeten Patienten: Validität und Zuverlässigkeit der Verwirrungsbewertungsmethode für die Intensivstation (CAM-ICU). JAMA 286(21), 2703–2710 (2001).

Artikel CAS PubMed Google Scholar

Ely, EW et al. Beurteilung des Delirs bei kritisch kranken Patienten: Validierung der Verwirrungsbewertungsmethode für die Intensivstation (CAM-ICU). Krit. Pflege Med. 29(7), 1370–1379 (2001).

Artikel CAS PubMed Google Scholar

Amerikanische Psychiatrie-Vereinigung. Diagnostisches und statistisches Handbuch psychischer Störungen: DSM-IV, 4. [rev.] Auflage (American Psychiatric Association, 1998).

Google Scholar

Delorme, A., Sejnowski, T. & Makeig, S. Verbesserte Erkennung von Artefakten in EEG-Daten mithilfe von Statistiken höherer Ordnung und unabhängiger Komponentenanalyse. Neuroimage 34(4), 1443–1449 (2007).

Artikel PubMed Google Scholar

Goldberger, AL et al. PhysioBank, PhysioToolkit und PhysioNet: Komponenten einer neuen Forschungsressource für komplexe physiologische Signale. Auflage 101(23), e215–e220 (2000).

Artikel CAS PubMed Google Scholar

van Sleuwen, M. et al. Physiologische Beurteilung des Schweregrads des Delirs: Der Schweregradwert der elektroenzephalographischen Verwirrungsbewertungsmethode (E-CAM-S). Krit. Pflege Med. 50(1), e11–e19 (2022).

Artikel PubMed PubMed Central Google Scholar

Yamanashi, T. et al. Die topologische Datenanalyse (TDA) verbessert den bispektralen EEG-Algorithmus (BSEEG) zur Erkennung von Delir. Wissenschaft. Rep. 11(1), 304 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Referenzen herunterladen

Malissa Mulkey wurde von einem NRSA T32 NR018407 des National Institute of Nursing Research finanziert. Diese Forschungsstudie wurde von der American Association of Critical Care Nurses finanziert.

College of Nursing, University of South Carolina, Columbia, SC, USA

Malissa A. Mulkey

Abteilung für Computer- und Informationstechnologie, Purdue University, Lafayette, IN, USA

Huyunting Huang & Baijian Yang

Fakultät für Ingenieurwissenschaften, University of East Carolina, Greenville, NC, USA

Thomas Albanese & Sunghan Kim

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

MM war für die Konzeption des Studiendesigns, die Interpretation der Analyseergebnisse, den Entwurf des Manuskripts und die Zustimmung zur Genauigkeit und Integrität der Arbeit verantwortlich. TA war für die Gestaltung und Durchführung der Analyse, die Interpretation der Ergebnisse, die Ausarbeitung des Artikels und die Zustimmung zur Richtigkeit und Vollständigkeit verantwortlich. HH war für die Gestaltung der Analyse, die Interpretation der Ergebnisse, die Ausarbeitung des Artikels und die Zustimmung zur Richtigkeit und Vollständigkeit verantwortlich. BY war für die Gestaltung der Analyse, die Interpretation der Ergebnisse, die Ausarbeitung des Artikels und die Zustimmung zur Richtigkeit und Vollständigkeit verantwortlich. SK war für die Gestaltung und Durchführung der Analyse, die Interpretation der Ergebnisse, die Ausarbeitung des Artikels und die Zustimmung zur Richtigkeit und Vollständigkeit verantwortlich. Alle Autoren haben die endgültige Version überprüft und genehmigt.

Korrespondenz mit Malissa A. Mulkey.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die Originalautor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Mulkey, MA, Huang, H., Albanese, T. et al. Überwachtes Deep Learning mit Vision Transformer sagt Delir mithilfe eines begrenzten Ableitungs-EEG voraus. Sci Rep 13, 7890 (2023). https://doi.org/10.1038/s41598-023-35004-y

Zitat herunterladen

Eingegangen: 11. Oktober 2022

Angenommen: 11. Mai 2023

Veröffentlicht: 16. Mai 2023

DOI: https://doi.org/10.1038/s41598-023-35004-y

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.