Institutional Money, Ausgabe 4 | 2025
K ünstliche Intelligenz verspricht, Aktienmärkte zu schlagen. Doch neue Forschung zeigt: Die meis- ten KI-Handelsstrategien scheitern, sobald sie län- ger als ein Jahr getestet werden. Das Problem liegt nicht in der Technologie – sondern in fehlerhaften Tests. Large Lan- guage Models (LLMs) werden zunehmend in der Finanz- HQWVFKHLGXQJVljQGXQJ HLQJHVHW]W LQVEHVRQGHUH ]XU *HQHULH- rung vonAnlagemaßnahmenwie Kaufen, Halten oder Ver- kaufen. Diese sogenannten LLM-Timing-basierten Anlage- strategien nutzen die Fähigkeit der LLMs, historische und Echtzeitdaten zu interpretieren, um autonom zu handeln. Vom sentimentgesteuerten Handel bis hin zu komplexen Multi-Agenten-Systemen untersucht eine wachsende Zahl von Arbeiten das Potenzial von LLMs als autonome Finanz- DJHQWHQ 'LHVH ., $JHQWHQ WUHȬHQ $QODJHHQWVFKHLGXQJHQ DXI GHU *UXQGODJH XQVWUXNWXULHUWHU )LQDQ]GDWHQ Backtesting ist die Standardmethode zur Bewertung von Anlagestrategien, bei der diese anhand historischer Daten simuliert werden, um Rentabilität und Robustheit zu bewerten. Die aktuelle LLM-Investment-Forschung leidet jedoch unter fragmentierten, unterentwickelten Bewertungspraktiken. Die meisten Studien bewerten die Performance über kurze Zeiträume, anhand weniger $NWLHQV\PEROH XQG JHEHQ KÌXljJ GHQ &RGH QLFKW IUHL ZDV GLH 5HSURGX]LHUEDUNHLW HLQVFKUÌQNW 'DVV GLH (ȬHNWL- vität dadurch überbewertet werden könnte, zeigt eine Stu- die von Forschern der University of Edinburgh, der Sung- N\XQNZDQ 8QLYHUVLW\ GHU 8&/$ XQG GHU 8QLYHUVLW\ RI Oxford unter Leitung von Weixian Waylon Li. Dabei stel- len sie fest, dass andere Kapitalmarktforscher mit mehreren neuerenMethoden Strategien über unterjährige Zeiträume mit weniger als zehn Aktien analysieren und diese nur mit naiven Benchmarks wie Buy and Hold vergleichen (siehe Tabelle „Zusammenfassung von LLM-basierten Investmentstra- tegien“) . Solche kurzen Zeiträume und engen Aktienuniver- sen führen zu drei gut dokumentiertenQuellen vonVerzer- rungen: erstens zumSurvivorship Bias, bei demnicht mehr gelistete oder wertlos gewordene Aktien nicht berücksich- tigt werden. Zweitens kommt es zu einem Look-Ahead Bias, bei dem zukünftige Informationen unbeabsichtigt YHUJDQJHQH (QWVFKHLGXQJHQ EHHLQijXVVHQ 8QG VFKOLHĕOLFK führt es auch zu einer Daten-Mining-Verzerrung, bei der die Strategieperformance durch wiederholte Tests mit den- selbenDaten aufgebläht wird. Diese Verzerrungen können zu irreführenden Performanceeinschätzungen führen und die Validität behaupteter Verbesserungen gegenüber tradi- tionellen Methoden untergraben. Dies wirft eine zentrale Frage auf: Können LLM-basierte Anlagestrategien länge- ren und umfassenderen Robustheitsbewertungen stand- halten? Diese Problematik wirft grundsätzliche methodi- sche Fragen auf. Verzerrungen und Robustheitsprobleme Die robuste Bewertung von Finanzstrategien erfordert sorg- IÌOWLJ NRQ]LSLHUWH %DFNWHVWV ,P *HJHQVDW] ]X W\SLVFKHQ Machine-Learning-Aufgaben mit großen, sauberen Daten- sätzen sind Finanzdaten durch Noise verunreinigt (ver- rauscht), nicht stationär und in ihrem Umfang begrenzt. Daher sind Backtests besonders anfällig für drei Haupt- quellen von Verzerrungen: Survivorship Bias, Look-Ahead Bias und Data-Snooping Bias. Diese können die wahr- genommene Performance überbewerten und zu irrefüh- renden Schlussfolgerungen führen. Tesla, Amazon, Microsoft – viele KI-gestützte Handelssysteme versprechen Traumrenditen mit genau diesen Aktien. Doch ein internationales Forscherteam zeigt: Die Tests sind manipuliert. » Bewertungen von LLM-basierten Timing-Anlagestrategien geschehen meist auf Basis enger Zeitrahmen und kleiner Aktienuniversen. « Mihai Cucuringu, Professor of Mathematics an der University of California Los Angeles Zu viel versprochen? 96 N o . 4/2025 | institutional-money.com THEORIE & PRAXIS | Investmentstrategien FOTO: © MIHAI CUCURINGU
Made with FlippingBook
RkJQdWJsaXNoZXIy ODI5NTI=