Postavke privatnosti

MIT warnt: Klassische Konfidenzintervalle können in räumlichen Analysen des maschinellen Lernens täuschen

Forscher des MIT warnen, dass übliche statistische Methoden in räumlichen Analysen oft einen falschen Eindruck von Zuverlässigkeit erzeugen. Ein neuer wissenschaftlicher Ansatz ermöglicht genauere Konfidenzintervalle bei der Schätzung von Variablenzusammenhängen in Umwelt-, Gesundheits- und Wirtschaftsforschung.

MIT warnt: Klassische Konfidenzintervalle können in räumlichen Analysen des maschinellen Lernens täuschen
Photo by: Domagoj Skledar - illustration/ arhiva (vlastita)

In der Forschung, die sich auf Daten von Karten und Messstationen stützt, wird oft angenommen, dass die „Unsicherheit gelöst“ ist, sobald ein Computermodell die vorherzusagenden Werte gut errät. Doch in realen Analysen sind Wissenschaftler und Entscheidungsträger meist nicht nur an der Prognose interessiert, sondern auch an der Frage des Zusammenhangs: Ist eine bestimmte Exposition mit einem Ergebnis verbunden, in welcher Richtung und wie stark ist der Effekt. Genau hier – bei der Schätzung der Zusammenhänge von Variablen im Raum – hat ein Forscherteam des MIT gezeigt, dass gängige Methoden zur Berechnung von Konfidenzintervallen in räumlichen Einstellungen ernsthaft versagen und Intervalle erzeugen können, die überzeugend aussehen, aber falsch sind.


Stellen wir uns ein Szenario aus dem öffentlichen Gesundheitswesen vor: Ein Umweltwissenschaftler in einem Landkreis möchte abschätzen, ob die Exposition gegenüber Luftverschmutzung mit niedrigeren Geburtsgewichten verbunden ist. In der Ära großer Datensätze ist es ein natürlicher Schritt, ein Modell des maschinellen Lernens zu trainieren, das komplexe, nichtlineare Beziehungen erfasst – denn solche Modelle brillieren oft in der Vorhersage. Das Problem entsteht, wenn von dem Modell etwas anderes verlangt wird: nicht „wie viel wird das Baby wiegen“, sondern „wie groß ist der Zusammenhang zwischen Exposition und Geburtsgewicht“ und mit welcher Sicherheit können wir das sagen.


Standardmethoden des maschinellen Lernens können Schätzungen und manchmal Unsicherheit für die Vorhersage selbst liefern. Doch wenn das Ziel darin besteht, einen Zusammenhang zwischen einer Variable (z. B. Feinstaub in der Luft) und einem Ergebnis (z. B. Geburtsgewicht) festzustellen, verlassen sich Forscher auf Konfidenzintervalle: einen Wertebereich, von dem erwartet wird, dass er mit einer bestimmten Wahrscheinlichkeit den tatsächlichen Effekt „abdeckt“. Bei räumlichen Problemen – wo sich Daten je nach Standort unterscheiden – warnt das MIT-Team, dass dieser Bereich völlig falsch sein kann, und zwar auf eine Weise, die den Benutzer zu einer falschen Schlussfolgerung führt: Die Methode kann „hohes Vertrauen“ behaupten, während die Schätzung den tatsächlichen Wert verfehlt hat.


Warum „95% zuverlässig“ manchmal nicht gilt


Die räumliche Analyse von Zusammenhängen befasst sich damit, wie Variable und Ergebnis in einem geografischen Gebiet verbunden sind. Ein Beispiel könnte das Verhältnis von Baumkronenbedeckung und Höhenlage in den USA sein oder die Verbindung zwischen Niederschlag und dem Ertrag einer Kulturpflanze. Der Forscher hat dabei oft „ursprüngliche“ Daten, die an bestimmten Standorten gesammelt wurden, und möchte das Verhältnis an einem anderen Standort schätzen, wo keine Messungen existieren oder selten sind. Im Idealfall gibt das Modell eine Schätzung und ein Intervall, das die Unsicherheit realistisch ausdrückt.


In der Praxis, warnen die Autoren, geschieht oft das Gegenteil: Die Methode kann behaupten, dass sie beispielsweise zu 95 Prozent sicher ist, dass das Intervall das wahre Verhältnis „eingefangen“ hat, während der tatsächliche Wert überhaupt nicht innerhalb dieses Bereichs liegt. Mit anderen Worten, das Konfidenzintervall sieht autoritativ aus, ist aber eigentlich – falsch. Solche „falsch sicheren“ Intervalle sind besonders riskant, wenn Ergebnisse für Umweltschutzpolitiken, Empfehlungen im öffentlichen Gesundheitswesen oder Schätzungen wirtschaftlicher Auswirkungen vor Ort verwendet werden, da Zahlen den Eindruck eines festen Beweises erwecken können, wo keiner ist.


Die Hauptursache liegt in den Annahmen, auf denen klassische Verfahren zur Intervallbildung beruhen. In der Statistik funktionieren Annahmen wie Spielregeln: Wenn sie gelten, sind die Schlussfolgerungen gültig; wenn sie nicht gelten, können Zahlen täuschen. Bei räumlichen Daten brechen einige der häufigsten Annahmen an mehreren Stellen.


Drei Annahmen, die bei räumlichen Daten brechen


1) i.i.d.-Annahme (unabhängig und identisch verteilt)
Viele Methoden gehen von der Idee aus, dass Beobachtungen voneinander unabhängig sind und aus der „gleichen“ Verteilung stammen. In der räumlichen Welt ist das oft nicht wahr. Ein oft angeführtes Beispiel ist die Anordnung von Messstationen: Standorte von Sensoren für Luftqualität sind nicht zufällig, sondern werden im Hinblick auf Infrastruktur, Bevölkerungsdichte, Industrie, Verkehr und das bestehende Messnetz ausgewählt. Das bedeutet, dass die Einbeziehung eines Standorts in die Daten stark beeinflusst, welche anderen Standorte vertreten sind.


2) Annahme eines perfekt korrekten Modells
Ein Teil der Verfahren für Konfidenzintervalle nimmt implizit an, dass das Modell „genau“ ist. Doch in realen Anwendungen sind Modelle Annäherungen: Sie lassen Variablen aus, vereinfachen Prozesse und beschreiben Rauschen falsch. Wenn das Modell verfehlt ist, können Intervalle, die sich auf dessen Richtigkeit stützen, unrealistisch eng und selbstsicher sein.


3) Ähnlichkeit von Ursprungs- und Zieldaten
Bei räumlichen Problemen besteht oft ein Unterschied zwischen den Daten, an denen das Modell gelernt wurde, und dem Ort, an dem man Schlussfolgerungen ziehen möchte. Beispiel: Ein Modell wird an städtischen Verschmutzungsmessungen trainiert (da Sensoren in Städten häufiger sind) und dann zur Schätzung von Verhältnissen in einem ländlichen Gebiet ohne Stationen verwendet. Urbanisierung, Verkehr und Industrie verändern die Eigenschaften der Luft, sodass das „Zielgebiet“ systematisch anders ist. Eine solche Verteilungsverschiebung kann eine Verzerrung in die Schätzung des Zusammenhangs einführen – und die nominelle Zuverlässigkeit des Intervalls zunichtemachen.


In Kombination schaffen diese drei Risse Raum für ein ernstes Problem: Das Modell kann den Effekt verfehlen, und das Intervall kann sich weiterhin so „verhalten“, als ob alles stimmt. Für Journalisten und öffentliche Institutionen ist dies besonders heikel, da in der öffentlichen Kommunikation Konfidenzintervalle oft in Behauptungen wie „wissenschaftlich bewiesen“ oder „mit großer Sicherheit“ übersetzt werden, ohne Einblick darin, inwieweit die Annahmen überhaupt erfüllt sind.


„Glätte“ als realistischere Annahme


Anstatt auf i.i.d. und auf der Überlappung von Ursprungs- und Zielstandorten zu bestehen, führen die Autoren eine Annahme ein, die in vielen räumlichen Prozessen intuitiver ist: dass sich Daten glatt durch den Raum ändern. In der mathematischen Sprache wird dies durch die Lipschitz-Bedingung beschrieben – die Idee, dass eine Änderung im Raum keinen beliebig großen Sprung im Wert erzeugen kann, sondern dass es eine Obergrenze dafür gibt, „wie schnell“ sich das Verhältnis ändern kann.


Für feine Partikel in der Luft ist das Beispiel fast greifbar: Wir erwarten nicht, dass das Verschmutzungsniveau in einem Häuserblock drastisch anders ist als im nächsten Häuserblock. Statt Sprüngen ist ein Bild des allmählichen Rückgangs häufiger, wenn wir uns von Emissionsquellen entfernen. Unter solchen Bedingungen ist Glätte eine Annahme, die näher an dem liegt, was tatsächlich in der Umwelt passiert, als die i.i.d.-„Idealisierung“.


Auf dieser Grundlage schlägt das MIT-Team ein Verfahren vor, das direkt mit der Möglichkeit einer Verzerrung durch nicht-zufällige Standortwahl und Verteilungsverschiebung rechnet. Ziel ist nicht nur, eine Schätzung des Zusammenhangs zu erhalten, sondern ein Konfidenzintervall zu bauen, das weiterhin eine sinnvolle Abdeckung (Coverage) hat – beziehungsweise das tatsächlich, so oft wie es behauptet, den wahren Wert des Parameters von Interesse enthält.


Was neu am Ansatz ist und warum es wichtig ist


Laut der Beschreibung in der Arbeit konstruiert die neue Methode gültige frequentistische Konfidenzintervalle für räumliche Zusammenhänge mit minimalen zusätzlichen Annahmen: einer bestimmten Form von räumlicher Glätte sowie einem homoskedastischen Gaußschen Fehler. Entscheidend ist auch das, was die Methode nicht erfordert: Die Autoren betonen, dass sie sich weder auf die vollständige Richtigkeit des Modells noch auf eine „Kovariaten-Überlappung“ zwischen Standorten, an denen gelernt wird, und Standorten, an denen der Effekt geschätzt wird, verlassen.


In der Praxis bedeutet das, dass die Methode auch verwendet werden kann, wenn Messungen in Städten gehäuft sind, und Schlussfolgerungen für die Peripherie oder ländliche Gebiete gesucht werden – ein Szenario, das oft in der Epidemiologie und in Umweltstudien auftritt. Wenn das Rauschniveau bekannt ist, geben die Autoren an, dass Intervalle auch in endlichen Stichproben gültig sein können; wenn das Rauschen nicht bekannt ist, bieten sie ein Verfahren zur Varianzschätzung an, das asymptotisch konsistent ist.


In Vergleichen bei Simulationen und auf realen Daten berichten die Autoren, dass ihr Verfahren das einzige ist, das konsequent zuverlässige Intervalle in Situationen liefert, in denen Standardansätze völlig versagen können. Mit anderen Worten, es handelt sich nicht um eine kosmetische Verbesserung, sondern um einen Versuch, das „Instrument zu reparieren“, das oft für Schlussfolgerungen über Beziehungen von Variablen im Raum verwendet wird.


Von der Prognose zur Erklärung: was das für Umwelt, Wirtschaft und Medizin bedeutet


In der Öffentlichkeit wird maschinelles Lernen oft als Werkzeug für „genauere Prognosen“ wahrgenommen. Doch in der Wissenschaft und in der Politik ist die Prognose erst der Anfang. Wenn das Gesundheitswesen abschätzt, wo in Prävention investiert werden soll, wenn eine Stadt Verkehrspolitiken plant oder wenn der Effekt von Aufforstung auf das Mikroklima geschätzt wird, ist die Frage: Wie stark ist der Zusammenhang und wie sicher sind wir uns bei dieser Schätzung?


Hier verwandelt sich die Rolle des Konfidenzintervalls in einen praktischen Vertrauensfilter. Wenn das Intervall fälschlicherweise hohe Sicherheit suggeriert, können Entscheidungen auf einer falschen Schätzung des Effekts basieren, und das kann eine Umleitung von Ressourcen oder falsche Interventionen bedeuten. Andererseits ermöglicht ein Intervall, das die Unsicherheit realistisch widerspiegelt, eine rationalere Planung: sowohl wenn der Effekt vorhanden ist, als auch wenn er klein ist, und wenn Daten noch nicht ausreichen, um mit Vertrauen zu schlussfolgern.


Die Autoren ordnen ihre Arbeit in ein breites Spektrum von Anwendungen ein: von Umweltwissenschaften (Verschmutzung, Niederschlag, Forstmanagement) über Epidemiologie bis hin zu wirtschaftlichen Analysen, die sich auf räumliche Daten stützen. In all diesen Bereichen gibt es ein gemeinsames Bedürfnis: ein „Modell, das gut vorhersagt“ von einem „Modell, dem wir vertrauen können, wenn es über Beziehungen spricht“ zu unterscheiden.


NeurIPS 2025: von der Theorie zur Gemeinschaft


Die Arbeit wurde auf der Konferenz NeurIPS 2025 vorgestellt, einer der einflussreichsten weltweiten Konferenzen für maschinelles Lernen und künstliche Intelligenz. Auf der offiziellen Programmseite wird eine Poster-Präsentation unter dem Titel „Smooth Sailing: Lipschitz-Driven Uncertainty Quantification for Spatial Associations“ aufgeführt, mit den Autoren David Burt, Renato Berlinghieri, Stephen Bates und Tamara Broderick, abgehalten am 3. Dezember 2025 im Rahmen des Konferenzprogramms.


Gleichzeitig ist eine Version der Arbeit auch als Preprint auf arXiv verfügbar, mit dem Hinweis, dass es sich um eine NeurIPS 2025 Referenz handelt und dass die ersten Versionen am 9. Februar 2025 eingingen, mit späteren Revisionen. Die Autoren veröffentlichten auch eine Referenzimplementierung des Codes, was in methodologischen Arbeiten entscheidend ist, damit Ergebnisse reproduziert und auf anderen Datensätzen überprüft werden können.


Mehr Informationen zur Arbeit und zu verbundenen Materialien sind verfügbar auf: arXiv-Seite der Arbeit, offizieller NeurIPS 2025 Poster-Karte und Code-Repository.

Unterkünfte in der Nähe finden

Erstellungszeitpunkt: 9 Stunden zuvor

Redaktion für Wissenschaft und Technologie

Unsere Redaktion für Wissenschaft und Technologie ist aus einer langjährigen Leidenschaft für das Erforschen, Interpretieren und Vermitteln komplexer Themen an alltägliche Leser entstanden. Bei uns schreiben Mitarbeiter und freiwillige Autoren, die seit Jahrzehnten die Entwicklungen in Wissenschaft und technologischer Innovation verfolgen – von Laborentdeckungen bis zu Lösungen, die den Alltag verändern. Obwohl wir in der Mehrzahl schreiben, steht hinter jedem Text eine echte Person mit umfangreicher redaktioneller und journalistischer Erfahrung sowie großem Respekt gegenüber Fakten und überprüfbaren Informationen.

Unsere Redaktion arbeitet aus der Überzeugung heraus, dass Wissenschaft am stärksten ist, wenn sie für alle zugänglich ist. Deshalb streben wir nach Klarheit, Präzision und Verständlichkeit, ohne jene Vereinfachungen, die die Qualität des Inhalts mindern würden. Oft verbringen wir Stunden mit dem Studium von Forschungsarbeiten, technischen Dokumenten und Fachquellen, um jedes Thema so zu präsentieren, dass es den Leser interessiert und nicht belastet. In jedem Text versuchen wir, wissenschaftliche Erkenntnisse mit dem realen Leben zu verbinden und zu zeigen, wie Ideen aus Forschungszentren, Universitäten und Technologielaboren die Welt um uns herum gestalten.

Unsere langjährige journalistische Erfahrung ermöglicht uns zu erkennen, was für den Leser wirklich wichtig ist – ob es um Fortschritte in der künstlichen Intelligenz geht, medizinische Entdeckungen, Energielösungen, Weltraummissionen oder Geräte, die unseren Alltag erreichen, bevor wir uns überhaupt ihre Möglichkeiten vorstellen können. Unser Blick auf Technologie ist nicht nur technisch; uns interessieren auch die menschlichen Geschichten hinter großen Entwicklungen – Forscher, die jahrelang an Projekten arbeiten, Ingenieure, die Ideen in funktionierende Systeme verwandeln, und Visionäre, die die Grenzen des Möglichen erweitern.

Auch ein starkes Verantwortungsgefühl leitet uns bei der Arbeit. Wir möchten, dass der Leser Vertrauen in die von uns gelieferten Informationen haben kann, daher überprüfen wir Quellen, vergleichen Daten und zögern mit der Veröffentlichung, wenn etwas nicht ganz klar ist. Vertrauen entsteht langsamer, als Nachrichten geschrieben werden, doch wir glauben, dass nur solch ein Journalismus langfristig wertvoll ist.

Für uns ist Technologie mehr als Geräte, und Wissenschaft mehr als Theorie. Es sind Bereiche, die Fortschritt antreiben, die Gesellschaft prägen und neue Möglichkeiten eröffnen für alle, die verstehen wollen, wie die Welt heute funktioniert und wohin sie morgen geht. Deshalb gehen wir jedes Thema mit Ernsthaftigkeit, aber auch mit Neugier an – denn gerade Neugier öffnet die Tür zu den besten Texten.

Unsere Mission ist es, den Lesern eine Welt näherzubringen, die sich schneller denn je verändert, im Bewusstsein, dass qualitativ hochwertiger Journalismus eine Brücke sein kann zwischen Experten, Innovatoren und all jenen, die verstehen wollen, was hinter den Schlagzeilen geschieht. Darin sehen wir unsere wahre Aufgabe: das Komplexe verständlich zu machen, das Entfernte nah und das Unbekannte inspirierend.

HINWEIS FÜR UNSERE LESER
Karlobag.eu bietet Nachrichten, Analysen und Informationen zu globalen Ereignissen und Themen, die für Leser weltweit von Interesse sind. Alle veröffentlichten Informationen dienen ausschließlich zu Informationszwecken.
Wir betonen, dass wir keine Experten in den Bereichen Wissenschaft, Medizin, Finanzen oder Recht sind. Daher empfehlen wir, vor der Entscheidungsfindung auf Basis der Informationen unseres Portals, sich mit qualifizierten Experten zu beraten.
Karlobag.eu kann Links zu externen Drittanbieterseiten enthalten, einschließlich Affiliate-Links und gesponserten Inhalten. Wenn Sie über diese Links ein Produkt oder eine Dienstleistung kaufen, können wir eine Provision erhalten. Wir haben keine Kontrolle über die Inhalte oder Richtlinien dieser Seiten und übernehmen keine Verantwortung für deren Genauigkeit, Verfügbarkeit oder für Transaktionen, die Sie über diese Seiten tätigen.
Wenn wir Informationen über Veranstaltungen oder Ticketverkäufe veröffentlichen, beachten Sie bitte, dass wir weder direkt noch über Vermittler Tickets verkaufen. Unser Portal informiert ausschließlich über Veranstaltungen und Kaufmöglichkeiten über externe Verkaufsplattformen. Wir verbinden Leser mit Partnern, die Ticketverkaufsdienste anbieten, garantieren jedoch nicht deren Verfügbarkeit, Preise oder Kaufbedingungen. Alle Ticketinformationen werden von Dritten bezogen und können ohne vorherige Ankündigung Änderungen unterliegen. Wir empfehlen, die Verkaufsbedingungen beim gewählten Partner vor einem Kauf sorgfältig zu überprüfen, da das Portal Karlobag.eu keine Verantwortung für Transaktionen oder Verkaufsbedingungen von Tickets übernimmt.
Alle Informationen auf unserem Portal können ohne vorherige Ankündigung geändert werden. Durch die Nutzung dieses Portals stimmen Sie zu, dass Sie die Inhalte auf eigenes Risiko lesen.