Das Fachmagazin für institutionelle Investoren

Geben Sie Ihren Benutzernamen und Ihr Passwort ein, um sich an der Website anzumelden:
1/2016 | Produkte & Strategien
twitterlinkedInXING

Wenn Maschinen managen

Mittlerweile gibt es erste Asset-Management-Strategien, die auf der Auswertung von Big Data basieren. Zunächst werden öffentlich zugängliche Daten im Netz gesammelt und ausgewertet, dann wird entsprechend des Algorithmus gehandelt.

1460462978_teaserbild15.jpg

Big-Data-Auswertung steht noch am Anfang, und es wird weiter daran gearbeitet. Beispielsweise gibt es zahlreiche Bots, die Falschnachrichten produzieren. Diese müssen herausgefiltert werden. Eine große Herausforderung stellt auch die Spracherkennung dar. Knifflig ist es beispielsweise, Ironie und Verneinungen zu erkennen, etwa die Aussage „nicht unerheblich“.

Big Data und künstliche Intelligenz sind zwar in aller Munde, aber dass eine Fondsstrategie ausschließlich mit der Auswertung von Big-Data-Informationen und den daraus gewonnenen Erkenntnissen über das Markt-Sentiment live umgesetzt wird, ist relativ neu. Das Frische an solchen Konzepten ist, dass sie relativ schlank umsetzbar sind. Hier bedarf es keiner 100-jährigen Tradition einer Privatbank und keiner enormen Kapitalausstattung, sondern einer guten Idee und gewiefter Techniker, die es schaffen, sinnvoll das Netz zu durchfors­ten und mit den ermittelten Daten umzugehen.


Newcomer Catana Capital
Ein aktuelles Beispiel ist das Konzept von Catana Capital, das sich gerade in der Umsetzungsphase befindet. Dieser Asset Manager, der gerade seine BaFin-Lizenzierung als Finanzportfolioverwalter nach § 32 KWG beantragt hat, beschäftigt ­lediglich vier Leute und verfügt über ein Anfangskapital von 100.000 Euro. Auch wenn er DAX-Portfolios steuert, muss er keine aufwendige Aktienanalyse vornehmen, sondern das erledigen Maschinen für ihn – und die Vielzahl der Daten, die es öffentlich und kostenlos im Netz gibt. Die Auflage des Fonds wird im ersten Halbjahr 2016 erwartet, und das Bankhaus Berenberg übernimmt die Rolle der Verwahrstelle. Nach sechs Monaten Testbetrieb wird die Strategie seit Mitte November 2015 mit echtem Geld gehandelt, die dann eins zu eins im Fonds weitergeführt werden soll (siehe Chart). Die Ursprünge des „FinTec 2.0“-Unternehmens Catana Capital liegen im Technologiebereich. Kooperiert wird mit der Stock­pulse GmbH aus Bonn, die es seit über sechs Jahren gibt.

 

Stockpulse konzentriert sich darauf, Nachrichten über Markt-Sentiment zur Verfügung zu stellen, und agiert als Forschungs- und Entwicklungs­unternehmen hinter Catana Capital. Die beiden Stockpulse-Gründer hatten sich zuvor am renommierten MIT mit Vorhersagen aus großen Datenmengen beschäftigt. Beispielsweise haben sie aus dem Stimmungsbild Vorhersagen für die Oscarverleihung ermittelt und konnten tatsächlich in zwei Jahren neun der zehn Oscars richtig prognostizieren. Offenbar schien ihnen dann aber der ­Finanzmarkt das attraktivere Anwendungsfeld zu sein.


Destillation von Webdaten
Die Strategie beruht darauf, dass unzählige Informationen aus dem Netz über bestimmte Unternehmen und den Gesamtmarkt aggregiert werden und daraus ein Sentiment für die Marktrichtung destilliert wird. Stockpulse sammelt Nachrichten zum Thema Wertpapiere und Märkte, die im ­Internet veröffentlicht werden. Der Crawler kann dabei via Sprach- und Texterkennung auf Englisch und Deutsch eine Vielzahl an Informationen abgreifen. Dabei werden klassische Nachrichten, aber auch Social-Media-Nachrichten ausgelesen, das heißt, was Menschen in Blogs oder Foren schreiben. Außerdem werden Schlüsselevents berücksichtigt, und Aktienresearch, das im Netz veröffentlicht wurde, wird verwertet.


Stockpulse wertet dabei nur solche Informationen aus, die ein-eindeutig zugeordnet werden können, nämlich einem bestimmten Wertpapier und einer bestimmten Person, von der die Information stammt. Auf diese Weise werden in Echtzeit Informationen zu mehr als 25.000 Wertpapieren, Rohstoffen, Währungen etc. gesammelt. Zusätzlich werden die Autoren der Tweets unterschiedlich gewichtet, je nachdem, wie relevant sie sind. Beispielsweise werden die Kommentare eines Hedgefonds­managers stärker gewichtet als die eines No-Name-Marktteilnehmers.


Im nächsten Schritt wird von Catana ­Capital aus der gesamten Datenmenge über einen Algorithmus auf Basis einer selbst­lernenden Datenbank eine Stimmung, das Sentiment, aggregiert. Der Fondsmanager trifft basierend darauf dann eine Anlage­entscheidung und tätigt die Orders. Die Aufträge und Positionen werden laufend überwacht, wobei zeitlich von morgens um acht Uhr bis abends um zehn Uhr der Handel möglich ist.


Handeln nur alle zwei Wochen
Gehandelt werden ausschließlich DAX-30-Titel und der DAX selbst, long und short. Auf der Long-Seite kauft Catana physische Aktien, und die Short-Seite wird über Single-Stock-Futures abgebildet. Den Index handelt der Fondsmanager über ­einen Future, um die Handelskosten gering zu halten. Das Portfolio sieht so aus, dass es zu jedem Zeitpunkt in weniger als 20 Einzelpositionen investiert ist: eine Selektion von Aktien in die Marktrichtung der Vorhersage (beispielsweise long) und andere Aktien entgegen dieser Marktrichtung (beispielsweise short). Auf diese Weise ist das Portfolio in sich selbst weitgehend ausbalanciert, und es ist marktunabhängig positioniert.


Der Fonds ist als Publikums-AIF geplant. Eine UCITS-Struktur würde zu stark einschränken, schließlich wird ein relativ konzentriertes Portfolio gefahren. Gehandelt wird im Durchschnitt nur alle zwei Wochen, wobei das Portfolio laufend anhand von ­sogenannten Sentiment-Triggern, Stopp-Loss-Limits und weiterer Risikokennzahlen überwacht wird.


Prognosekraft: zwei Wochen
Dass im Schnitt nur alle 14 Tage gehandelt wird, hört sich in der heutigen Zeit, da es im Hochfrequenzhandel um Sekundenbruchteile geht, eher träge an, aber es gibt eine Erklärung aus der klassischen Kapitalmarkttheorie: Die hunderttausendfach aggregierten Stimmungen und Meinungen der Marktteilnehmer haben erfahrungsgemäß eine Prognosekraft von etwa zwei Wochen. In Wirklichkeit scheinen die Kapitalmärkte also tatsächlich immer noch relativ ineffizient zu sein, und Informationen benötigen immer noch lange, bis sie sich voll in den Kursen ­widerspiegeln. Das CAPM beschreibt zwar Alpha, aber über 70 Prozent des Alphas lässt sich dadurch noch nicht erklären. Das ist Epsilon, der ‚Noise‘. Einen Teil dieses Noise macht Catana Capital jetzt durch die Big-Data-­Strategie greifbar.


Sobald die Erlaubnis vorliegt, will sich Catana für den Vertrieb zunächst auf kleinere institutionelle Adressen, sowie auf Vermögensverwalter und Family Offices konzentrieren. Am Anfang soll kein großer Retailvertrieb gemacht werden.


Datenbank mit historischen Mustern
Die Sorge, dass die Strategie jederzeit von einem „Tec-Kid“ kopiert werden kann, existiert nicht, da neben der technisch komplexen Datenaufnahme im Netz die Datenbank entscheidend ist. Die Güte der Vorhersage basiert sowohl auf den historischen Stimmungsbildern als auch auf dem Abgleich mit historischen Aktienkursbewegungen im Rahmen eines Machine-Learning-Ansatzes. Diese Technologie wurde seit zehn Jahren von Stockpulse aufgebaut, und seit fünf Jahren wird die Datenbank gefüttert. Es werden rund 300.000 Nachrichten pro Tag, das heißt vier pro Sekunde, gesammelt. Auf diese Weise fließen jeden Monat rund 1,5 Terabyte an Daten in die Datenbank ein – Tendenz steigend.


Big-Data-Auswertungen stehen vielfach noch am Anfang, daher dürfte es noch einige technische Schwierigkeiten geben, an ­denen Wettbewerber zu knabbern haben. ­Eine große Herausforderung ist natürlich die Spracherkennung. Wenn DAX-Titel gehandelt werden sollen, hilft eine rein englische Texterkennung nicht weiter, sondern es muss eine spezifische Texterkennung entwickelt werden. Außerdem gibt es inzwischen zahlreiche Bots, die Falschnachrichten produzieren, die es herauszufiltern gilt. Es gibt Tage, da sortiert Stockpulse allein aus Twitter 1.500 Bots heraus. Was sich auch recht knifflig gestaltet, ist, Ironie und Verneinungen, und erst recht doppelte Verneinungen zu erkennen, beispielsweise die Aussage „nicht unerheblich“.


Diese Herausforderungen gilt es zu meis­tern, und vermutlich wird man sich Stück für Stück einer Lösung nähern. Entsprechend ist damit zu rechnen, dass mit der Zeit weitere Big-Data-Manager auf den Markt kommen werden.


Sentix ermittelt Stimmung
Nicht ganz so automatisiert, aber auch auf Basis von aggregierten Sentiment-Daten vieler Marktteilnehmer arbeitet bereits seit 2010 Sentix Asset Management in Frankfurt. Sentix befragt wöchentlich rund 1.100 Marktteilnehmer per E-Mail-Umfrage. ­„Unsere Datenbasis enthält etwa 5.000 registrierte Nutzer, etwa ein Viertel davon sind Institutionelle und drei Viertel Private“, erklärt Sentix-Geschäftsführer Manfred Hübner. In seinen Erhebungen fragt er die kurz- und die mittelfristigen Erwartungen der Marktteilnehmer ab.


Ähnlich sind die Vorgehensweisen von Catana und Sentix in dem Sinne, dass sie das Sentiment der Marktteilnehmer aus ­einer Vielzahl von Daten und Meinungen ermitteln. Hübner weist auf einen wichtigen Unterschied hin: „Wir fragen bei unseren Usern die Einschätzungen ab, nachdem die Informationen bei den Leuten durch den Kopf gegangen sind und sie sich eine Meinung gebildet haben. Catana greift die Daten offenbar einen Schritt vorher ab, wenn die Leute sich im Netz äußern.“ Die Zukunft wird zeigen, ob sich eine der beiden Vorgehensweisen als die zuverlässigere ­erweist oder ob beide zum Ziel, sprich zu überdurchschnittlichen Ergebnissen, führen.


Panel-Befragung
Sentix fragt seine Teilnehmer, was sie über die Märkte fühlen und denken, und im zweiten Schritt dann auch, was sie tun, wie sie sich also allokieren. „Dadurch können wir beispielsweise beobachten, dass zunächst die Grundüberzeugung der Marktteilnehmer bezüglich der Märkte steigt und dann – mit einigem Zeitverzug – die tatsächlichen Investitionen getätigt werden“, erklärt Hübner und weiter: „Wir stellen bei der Sentiment-Auswertung immer wieder fest, dass die Leute ein sehr gutes Gespür dafür haben, ob ein Markt teuer oder billig ist. Aber unter dem Eindruck von Emotionen verzögert sich die Umsetzung des prinzipiell werthaltigen strategischen Bias durch Käufe und Verkäufe in den Portfolios.“


Sentix setzt seine Strategie in verschiedenen Spezialfonds und in zwei Publikumsfonds um: dem defensiven Mischfonds Sentix Fonds 1 (Auflage Oktober 2010, siehe Chart) und dem Aktienfonds Sentix Fonds Aktien Deutschland Auflage (März 2013).


100-köpfiges BlackRock-Team
Natürlich sind auch die globalen Player im Bereich Big-Data-Analyse aktiv, beispielsweise BlackRock, wo man nach eigenen Angaben seit sieben Jahren solche Analysen ernsthaft betreibt und mittlerweile 90 Milliarden Euro in der Scientific-Active- Equities-Plattform verwaltet. „Bei uns arbeiten derzeit gut 100 Individuen in dieser Sparte. 30 davon haben einen rein technologischen Background und haben beispielsweise zuvor bei Technologieunternehmen gearbeitet, sind also ohne Finanz-Background“, erklärt Simon Weinberger, Leiter des Scientific-Active-Equity-Geschäfts bei BlackRock in der Region EMEA. Er führt aus, dass qualifizierte Technikexperten notwendig sind, um die erforderliche Infrastruktur aufzubauen. Diese ist nötig, um die riesigen Datenmengen sinnvoll zu organisieren, auszuwerten und am Ende zu speichern. Letzteres ginge ohnehin nur in der Cloud, wo sich viel größere Datenmengen speichern ließen als auf einem lokalen ­Server. „Schließlich lesen wir täglich viele Gigabytes an Informationen ein“, so Weinberger.


Dass sich BlackRock überhaupt mit Big Data-Analyse befasst, erklärt Weinberger so: „Aufgrund der Erkenntnis, dass es schwierig ist, Alpha zu generieren, muss man Dinge aufdecken, die anderen weniger bekannt sind – beispielsweise Daten analysieren, die zuvor nicht analysiert wurden.“ Er ergänzt: „Leider gibt es nicht den einen einzigen magischen Internet-Faktor, der Aufschluss über die künftige Börsenentwicklung gibt, sondern man muss viele ­unterschiedliche Indikatoren aggregieren.“ Bisher analysiert Weinbergers Team Informationen in Textform, und zwar vornehmlich externe Daten, die öffentlich im Netz verfügbar sind. BlackRock wertet in erster Linie die Texte der Earnings Calls aus, wenn also Unternehmen ihre aktuellen Zahlen bekanntgeben. „Hierzu werden Trans­kripte ins Netz gestellt, und wir analysieren, wie viele positive und negative Phrasen diese enthalten und wie das Management auf die Fragen der Analysten reagiert“, so Weinberger. Da die Earnings Calls meistens vom CFO abgehalten würden, der ein Zahlenmensch sei, habe das für BlackRock ein größeres Gewicht als die dann folgenden Kommentare des CEOs. Durch die direkte Auswertung der Earnings Calls sei man den Reports, die daraufhin die Analysten ver­fassen, zeitlich voraus. Außerdem sei es sinnvoll, sich auf Phrasen zu konzentrieren, die auf die zukünftige Unternehmens­entwicklung Bezug nehmen, da dies mehr Aufschluss darüber gebe, wo künftig das Wachstum generiert wird.


Sentiment auslesen
Die Texterkennung von BlackRock erfolgt hauptsächlich für englischsprachige Texte. „Wir haben allerdings auch die ­Fähigkeit entwickelt, Japanisch und Chi­nesisch zu lesen, weil zum Beispiel viele ­japanische Unternehmen ihre Bekanntmachungen nur auf Japanisch darstellen“, so Weinberger. Daneben analysiert BlackRock auch Blogs. „Hier erfassen wir, worüber sich Kleinanleger unterhalten und was deren Präferenzen sind. In manchen Märkten – etwa China – spielen Kleinanleger eine bedeutende Rolle“, erklärt Weinberger. Teilweise werten BlackRocks Algorithmen die aggregierten Kleinanlegermeinungen aber als Kontraindikator, um bei einem Hype vorher aus einem möglicher­weise heißgelaufenen Markt auszusteigen.


Ein weiterer guter Indikator seien auch ETF-Ströme, nicht nur die der BlackRock-Tochter iShares. Weinberger dazu: „Das sind öffentlich zugängliche Daten. Mittlerweile werden rund ein Drittel der weltweiten Assets von ETFs gehalten – das hat natürlich ­Implikationen für die Marktentwicklung.“ Außerdem greifen BlackRocks Datenexperten auch auf eine Erweiterung des Service „Google Trends“ zu. „Dadurch können wir erkennen, wonach täglich im Internet gesucht wird, und in welcher Region. Hier haben wir Suchwörter gefunden, die ein Indikator für gute Konsumwerte sind, beispielsweise wie viel nach neuen Häusern oder nach Luxusgütern gesucht wird.“
Die technischen Herausforderungen, an denen man noch arbeitet, beschreibt Weinberger auch: „Wir arbeiten noch am Machine-Learning, etwa wie man effizient ein tatsächliches Signal vom allgemeinen Lärm differenzieren kann. Schließlich wollen wir robuste und belastbare Resultate. Derzeit beurteilt bei uns immer noch ein Fonds­manager, ob die gewonnenen Signale einen Sinn ergeben.“


Nach der Analyse der Daten wird die ­Order bei BlackRock von Individuen platziert, auch wenn der Prozess stark maschinenunterstützt ist. „Auch das Risikocontrolling und das Update der Prognosen werden von unseren Portfoliomanagern kontrolliert“, erklärt Weinberger.


Weitere Anbieter
Ansonsten steht die tatsächliche Nutzung von Big Data für Fondsstrategien noch ziemlich am Anfang. Bisher hörte man hier eher von Hedgefonds wie Cayman Atlantic, der sich auf die Analyse von Twitter-Nachrichten spezialisiert, Renaissance oder Two Sigma. Aber das Interesse an einer sinnvollen Nutzung der vorhandenen Datenberge ist da. Daher konnten sich schon einige Dienstleister, die sich damit befassen, etablieren. In Deutschland betreibt beispielsweise SentiTrade von YukkaLab in Berlin Data Mining. YukkaLab bezeichnet sich selbst als „die Stimmungskenner“, verkauft Übersichten über die Stimmungsentwicklung und stellt Buy- und Exit-Signale zur Verfügung. Auch Sowa Labs aus Stuttgart bieten Sentiment-Daten zu Einzelaktien, Indizes, Rohstoffen, Währungen und Anleihen sowie maßgeschneiderte Big-Data-Lösungen. Ähnliches im Angebot haben die beiden Schweizer Unternehmen Sentifi sowie das Start-up Sentiment Studies Ltd.


International gibt es viele weitere Häuser, die das Markt-Sentiment erfassen und publizieren, überwiegend aus den USA und entsprechend auf englischsprachige Text­erfassung fokussiert. Beispiele hier sind Blogger Sentiment Poll, LexisNexis, RavenPack, Accern, Palantir und Dataminr.


Bei dem Trend, Sentiment-Daten aus Big Data zu generieren, haben wir es mit einer interessanten Spielart der Behavioral Fi­nance zu tun, und vermutlich werden künftig deutlich mehr Manager solche Informationen mitberücksichtigen. Wenn wirklich 90 Prozent der weltweiten Daten in den vergangenen zwei Jahren generiert wurden, wie IBM 2015 mitteilte, ist es sicher nicht die richtige Strategie, das zu ignorieren.


Anhang:

twitterlinkedInXING
 Schliessen

Mit der Nutzung dieser Website stimmen Sie der Verwendung von Cookies und unserer Datenschutzerklärung zu. Mehr erfahren