Institutional Money, Ausgabe 3 | 2025

D ata-Mining ist ein Prozess, bei dem große Daten- mengen systematisch analysiert werden, um darin verborgene Muster, Zusammenhänge oder Trends zu entdecken. Doch in der Praxis enttäuschen viele Ergebnisse, die sich imUntersuchungszeitraum als statistisch signifikant erwiesen haben. Dafür gibt es verschiedene Gründe. Zum einen sind die Kapitalmärkte dynamisch, sie verändern sich immer wieder. Deshalb könnte das, was heute funktioniert,morgen keinen Vorteil mehr bringen. Zum anderen werden Studien vor allem dann veröffentlicht, wenn sie interessante Ergebnisse liefern. Tatsächlich gibt es in der akademischen Forschung deshalb einen Anreiz für exzessives Data-Mining und das „Erschaffen“ signifikanter Ergebnisse (siehe auch „Geplatzte Renditeträume“, Institutional Money 3/2022). Von den vie- len Versuchen, bei denen nichts Brauchbares herauskam, liest man dagegen meist nicht. Dabei können mit moder- nen Computern problemlos unzählige Parameter und Kombinationsmöglichkeiten untersucht werden, von denen einige rein zufällig statistisch signifikant erscheinen. Das führt zu falsch-positiven Ergebnissen, die außerhalb der Testdaten kaum Aussagekraft haben. Oft lässt sich aber im Nachhinein eine gute Erklärung für den gefundenen Zusammenhang finden. Dadurch sieht es dann so aus, als wäre dieses Muster von Vornherein so vermutet worden. Das Ergebnis wirkt also wie eine bestätigte Theorie, obwohl es eigentlich ein Zufallsfund war. Scheinbare Kleinigkeiten Die Methoden, mit denen sich statistisch signifikante Er- gebnisse bewusst erzielen lassen, sind nicht nur vielfältig, sondern von außen auch kaum nachvollziehbar beziehungs- weise überprüfbar. Ein Beispiel sind die Details, mit denen Portfolios konstruiert werden. Dazu gehören die Ent- scheidungen, wie oft ein Rebalancing erfolgt, wie die Titel gewichtet sind und ob Aktien von Finanzfirmen einbezo- gen oder ausgeschlossen werden. Im Paper „Looking Under the Hood of Data-Mining“ untersucht Mathias Hasler, ob diese Entscheidungen statis- tische Verzerrungen hervorrufen.Wenn das der Fall ist, soll- ten die Portfolios im Untersuchungszeitraum bessere Ergebnisse aufweisen als bei zufälliger Festlegung dieser Eigenschaften. Außerhalb der Stichprobe sollten die Ergeb- nisse aber ähnlich sein. Tatsächlich findet sich dieses Muster. Demnach erzielen Portfolios, die auf Grundlage der präzi- sen Kriterien der Forscher zusammengestellt wurden, im jeweiligen Untersuchungszeitraum um 0,29 Prozentpunkte höhere Renditen als Portfolios mit einer zufälligen Kombi- Dass Rückrechnungen mit Vorsicht zu genießen sind, ist bekannt. Immer öfter sind es aber kleine Dinge, die zu statistischen Verzerrungen führen. Schon wenn an scheinbar unwesentlichen Details gedreht wird, kann es zu Überoptimierungen kommen. Geplatzte Ertragsträume Klarer Einfluss Portfoliorenditen hängen von den Einstellungen scheinbarer Detailparameter ab. Die Grafik vergleicht die Monatsrenditen auf Basis der exakten Einstellungen der Originalstudien mit denen zufälliger Einstellun- gen aus der Literatur sowohl innerhalb als auch außerhalb der Stichprobenzeiträume. In Sample machen die Entscheidungen der Forscher mit einem Extra von 0,23 Prozentpunkten pro Monat fast die Hälfte der Renditevorhersagbarkeit aus (links). Out of Sample verschwinden rund 60 Prozent der mit den Entscheidun- gen der Forscher verbundenen Renditen (rechts). Quelle: Hasler, M. (2023), Looking Under the Hood of Data-Mining, Boston College 0,0 % 0,1 % 0,2 % 0,3 % 0,4 % 0,5 % 0,6 % Monatliche Rendite 130 N o . 3/2025 | institutional-money.com THEORIE & PRAXIS | Data-Mining FOTO: © DIMENSIONAL FUND ADVISORS

RkJQdWJsaXNoZXIy ODI5NTI=