Institutional Money, Ausgabe 1 | 2025

ner ML-Modelle für künftige Fonds üsse im Zeitraum von Januar 2000 bis Dezember 2020 zeigen. Zu diesem Zweck verwenden sie die Out-of-Sample-R²-Statistik, die die Pro- gnosen mit dem historischen Mittelwert der Fonds-Flows vergleicht, wie dies John Campbell and Samuel B. Thomp- son 2008 in „Predicting Excess Stock Returns Out of Sample: Can Anything Beat the Historical Average?“ anreg- ten. Um zu beurteilen, ob einige Modelle deutlich bessere Vorhersagen liefern als andere, führt das Autorenteam paar- weise Vergleiche der Vorhersagegenauigkeit verschiedener Prognosemodelle unter Verwendung der modellfreien modi"zierten Teststatistik nach Diebold-Mariano bezie- hungsweise Kenneth D.West durch. Ausgangspunkt: 30 Variablen Für ihre empirische Untersuchung ermitteln sie zunächst 30 Variablen, die einen Ein uss auf die Kapitalströme auf der Grundlage der bisherigen Literatur haben könnten. Diese Variablen sind hauptsächlich mit der früheren Performance und den Fondscharakteristika verbunden. Bei der einfachen OLS-Regression kann die große Anzahl von Regressoren, von denen einige hoch korreliert sind, problematisch sein. Daher extrahieren sie zunächst die Hauptkomponenten (Principal Components) aus den potenziellen Prädiktoren und verwenden diese dann als erklärende Variablen. Sie stel- len fest, dass lineare Modelle wie OLS und Elastic Net ein positives Out-of-Sample-R² von etwa 14 Prozent erreichen, wobei eine Benchmark in Form historischer Mittelwert- Flows verwendet wird. Nichtlineare ML-Modelle wie Random Forest und Gradient Boosting verbessern dieses Maß um etwa fünf Prozentpunkte (siehe Tabelle „Out-of- Sample-Modellvergleich“) . Um zu testen, ob sich die durchschnittliche Prognose- genauigkeit in Expansionen und Rezessionen unterscheidet, wenden die Autoren einen Welch-Test an und geben die entsprechende t-Statistik in der letzten Spalte (Exp.-Rec) an. Die statistische Signi"kanz des R²-Maßes wird anhand der Statistik von Clark und West (2007) (einseitiger Test) bewer- tet. Diese Ergebnisse erweisen sich über den Konjunktur- zyklus hinweg als robust, und die Vorhersagegenauigkeit der angewandten Prognosemodelle bleibt auch in wirtschaftlich schlechten Zeiten bestehen, die durch verstärkte Ab üsse aus riskanten Assetklassen gekennzeichnet sind (siehe Tabelle „Out-of-Sample-Modellvergleich in Expansionen und Rezessio- nen“) . Darüber hinaus werden die Ergebnisse durch paarweise Prognosegenauigkeitstests unter Verwendung modi"zierter Tests nach Diebold-Mariano und West bestätigt: Unter allen statistischen Modellen sind die Prognosen des Random- Forest-Ansatzes signi"kant besser bei einer Kon"denz von 99 Prozent als die Vorhersagen aller anderen Prognose- methoden. Dies steht im Einklang mit der Arbeit unter dem Titel „Machine Learning and Fund Characteristics Help to Select Mutual Funds with Positive Alpha“, die von Victor DeMiguel, Javier Gil-Bazo, Francisco J. Nogales und Andre A. P. Santos 2023 verö entlicht wurde. Diese ver- wendet einen ähnlichen Datensatz zur Prognose der Wert- entwicklung von Fonds. Auf diese drei Variablen kommt es an Während frühe ML-Prognoseansätze oft als Blackbox mit schwer zu interpretierenden Ergebnissen kritisiert wurden, wurden in den letzten Jahren erhebliche Fortschritte erzielt, die eine Analyse der spezi"schen Faktoren ermöglichen, die Mittelwert der SHAP-Werte für das Random-Forest-Modell Vergangene Fondsflüsse, Morningstar-Rating und Volatilität der Flows dominieren. Rank 30 Fondscharakteristika Durchschnitt 1 Vergangene Fondsflüsse (Flows) 0,1534 2 Morningstar-Rating 0,0528 3 Volatilität der Fondsflüsse 0,0297 4 Fondsalter 0,0204 5 Fondsvermögen 0,0198 6 t-stat (FF3; Drei-Faktor-Modell) 0,0175 7 Realisiertes (FF3) 0,0131 8 t-stat (CAPM) 0,0113 9 Excess Return 0,0106 10 Fondskosten 0,0090 11 TNA (Fonds) 0,0089 12 Sharpe Ratio 0,0088 13 t-stat (FFC; Vier-Faktor-Modell) 0,0085 14 Realized (CAPM) 0,0084 15 Realized (FFC) 0.0069 16 Umschlagshäufigkeit 0,0063 17 Volatilität der Renditen 0,0044 18 Vermögenszuwachs 0,0043 19 t-stat (FF5; Fünf-Faktor-Modell) 0,0042 20 Adjustiertes R ² 0,0041 21 t-stat SMB (FF5 + Momentum; MoM) 0,0041 22 t-stat HML (FF5 + MoM) 0,0033 23 Realisiertes (FF5) 0,0031 24 t-stat CMA (FF5 + MoM) 0,0030 25 t-stat RMW (FF5 + MoM) 0,0028 26 t-stat MoM (FF5 + MoM) 0,0026 27 t-stat alpha (FF5 + MoM) 0,0024 28 t-stat RMRF (FF5 + MoM) 0,0023 29 Realisiertes (FF5 + MoM) 0,0021 30 Größe des Managementteams 0,0006 Auflistung der durchschnittlichen absoluten SHAP-Werte über alle Prognosezeiträume (gleichgewichtet) jedes einzelnen der 30 Fondscharakteristika für einen einmonatigen Prognosehori- zont für Random Forest. SHAP-Werte werden über den Out-of- Sample-Zeitraum von Januar 2000 bis Dezember 2020 berechnet. Quelle: Studie 136 N o . 1/2025 | institutional-money.com THEORIE & PRAXIS | Asset Flows

RkJQdWJsaXNoZXIy ODI5NTI=