Aktuelles zur professionellen Vermögensberatung

Machine (l)earning

0
Share.

Autorin: Razije Tairi

 

Menschen können relativ einfach die Stimmung aus Neuigkeitsmeldungen interpretieren, jedoch liegt die Herausforderung darin, dass wenn man mehrere Unternehmensaktien im Portfolio hält und diese regelmässig in News und Social Media erwähnt werden. Ein durchschnittlich Erwachsener liest ca. 300 Wörter pro Minute und bräuchte somit 2 Minuten für einen Artikel mit 600 Wörtern. Während diesen zwei Minuten wurden die restlichen Unternehmen im Portfolio in weiteren News erwähnt – Die Menge an Informationen von einzelnen oder mehreren Aktientiteln übersteigt das menschliche Auffassungsvermögen und genau hier kommt „Sentiment Analysis“ ins Spiel.

Sentiment Analysis auf Handelsstrategien angewendet, bedeutet, dass die Stimmung aus den aggregierten Neuigkeitsmeldungen dazu dient Kauf- und Verkaufssignale zu bestimmen. Die üblichste Handelsstrategie basierend auf Sentiment Analysis wäre, bei positiver Stimmung in den Nachrichten, die Aktie zu kaufen und bei negativer Stimmung zu verkaufen. Aus Behavioral Finance Sicht liegt die Annahme zu Grunde, dass wenn positive Informationen über ein bestimmtes Unternehmen publiziert werden, Händler vermehrt kaufen, was wiederum zu einem Preisanstieg führt. Bei negativen Neuigkeitsmeldungen gerade umgekehrt, setzt Händler in Angst und es kommt zu Verkäufen und dadurch einer Preissenkung. Somit ist Zeitpunkt bzw. Reaktionszeit und Informationsressource ausschlaggebend für eine erfolgreiche Handelsstrategie.

In der Vergangenheit nutzten Händler mehrheitlich historische Preise und Volumen um Preisvorhersagen zu treffen. Mit Sentiment Indikatoren ist das als würde man zum bestehenden Auto- und Schiffsverkehr Flugzeuge hinzufügen.

 

Thinking fast and Social Media

Durch Social Media ist ein neuer Geschäftszweig entstanden, in welchem Unternehmen (Isentium, Sentify) Computer-Algorithmen verwenden um eine grosse Menge an Kurznachrichten oder sogenannte Mirco Blogs automatisch zu lesen und zu interpretieren, um vorhersagen betreffend Märkte, Indizes oder einzelne Aktientitel zu treffen.

Social Media erzeugt täglich ein riesiges Datenvolumen und wird nicht nur für die Stimmungserkennung an Aktienmärkten genutzt, sondern auch in anderen Bereichen wie zum Beispiel Filmindustrie oder Präsidentschaftswahlen um Erfolgschancen im Vorfeld vorherzusagen. Im Gegensatz zu offiziellen Unternehmensnachrichten gelangen Social Media Beiträge „ungefiltert“ und „stimmungsgeladen“ innerhalb von Sekunden von Millionen von Benutzern in den Markt.

Twitter hat innerhalb von 7 Jahren die Anzahl an aktiven Nutzern verzehnfacht und registrierte im März 318 Millionen.

Vor sieben Jahren hat Johann Bollen mit seiner Studie „Twitter mood predict stock market“ erstmals bei Finanzmarktteilnehmern für Aufmerksamkeit gesorgt. In seinem Experiment hat er gezeigt, dass Aktienpreise nicht per se einem Random Walk folgen, sondern bis zu einem Grad durch den Einsatz von Sentiment Analysis vorhersehbar sind. Heute, hat sich nicht nur die Anzahl Tweets erhöht, sondern auch die Art und Weise wie Micro Blogs maschinell gelesen und klassifiziert werden weiterentwickelt.

In der Twitter-Community wird das $-Zeichen vor einem Aktiensymbol gesetzt, wenn über eine bestimmte Aktie getwittert wird (beispielsweise für die Apple Aktie – $AAPL). Dadurch können Twittermeldungen von einzelnen Aktientiteln herausgefiltert und titelspezifisch analysiert und verfolgt werden.

Um festzustellen, ob eine signifikante Beziehung zwischen Twittermeldungen, welche das $+Aktiensymbol enthalten, und deren Kursentwicklung besteht, habe ich im Rahmen meiner Master Arbeit diesen Zusammenhang untersucht. Mit Hilfe der kreierten Twitter Stimmungsindikatoren pro Minute und pro Tag wurden unterschiedliche Handelsstrategien entwickelt und anschliessend mit einer buy-and-hold Strategie verglichen.

Vom 21. März bis 2. Juni 2017 wurden insgesamt 156`619 Tweets mit dem Aktiensymbol AAPL (Apple Inc.), BAC (Bank of America), CSCO (Cisco Systems) und XOM (Exxon Mobile Corporation) aus Twitter extrahiert und in positiv, negativ und neutral klassifiziert. Twitter erlaubt durch die API Schnittstelle das Extrahieren von Twitter Nachrichten, jedoch sind diese zeitlich und mengenmässig limitiert. Das Verkaufen von aggregierten Daten gehört inzwischen für Twitter zum festen Bestandteil des Geschäftsmodells. Auf meine Anfrage hin: „Entry level data sets include up to 1 Million Tweets over a 40 day period and start at 1250$. Pricing is inelastic until either threshold is exceeded. Price is impacted by both time frame and Tweet payload size”.

Bevor ein Stimmungsindikator definiert werden kann, müssen vorerst die Tweets, beziehungsweise die vorkommenden Wörter, klassifiziert werden. Jedes Wort durchläuft mehrere Etappen bis es als positiv, negativ oder neutral klassifiziert ist. Zum Beispiel verwenden Programme wie General Inquirer, DICITION 5.0, MPQA oder SentiWord-Net generische Lexikons (Harvard Wörterbuch IV-4, Lasswell Wörterbuch), welche Wörter bereits als positiv oder negativ definiert haben und diese mit den Wörtern in den Kurznachrichten vergleichen. Lexikon basierte binäre Klassifikationsverfahren eignen sich insbesondere für positive und negative Stimmungserkennung.

Obwohl kritisiert wird, dass die verwendete Sprache in Micro Blogs oft anders ist als durch die generischen Lexikons (Harvard Wörterbuch IV-4, Lasswell Wörterbuch) definiert. So ist zum Beispiel das Wort „explosiv“ in einem generischen Lexikon als negativ definiert, aber in der Finanzwelt „explosive rise“ hingegen positiv zu werten. Es werden bereits sogenannte „financial lexicons“ oder „microblog financial lexikon“ kreiert, aber die verwendeten Ausdrücke und Wortkombinationen müssen mühsam im Vorfeld einzeln definiert werden – dieser Labelling-Prozess ist zeit- und kostenintensiv. Eine weitere Herausforderung bei der automatischen Stimmungserkennung ist das sogenannte „Noise“-Nachrichten die Stimmung verzerren. Hinsichtlich dieser Herausforderung hat Reuters ein News-Analysetool für Algorithmen basierendes Handeln konzipiert, welche sprachliche Muster erkennt und relevante von irrelevanten Nachrichten gesondert analysiert. Im Bereich Machine learning tut sich einiges, jedoch bleiben Erkenntnisse, Methodisches Vorgehen und Programme nur einer kleinen Anzahl von Investoren vorbehalten.

Das Experiment

Die nachfolgende Abbildung gibt einen Überblick wie die Twitter Daten einerseits statistisch (Time Series Analysis & Vector Auto Regression) und andererseits auch ökonomisch mit Hilfe von verschiedenen Handelsstrategien (Trading Rule) analysiert wurden.

 

 

Resultate

Ein statistischer Zusammenhang konnte zwischen Twitternachrichten, welche $AAPL enthielten, und den Apple Aktienrenditen auf Minuten Basis nachgewiesen werden.

Abgesehen von den statistischen Ergebnissen war eine treibende Frage – schlägt eine Handelsstrategie basierend auf Twitter-Daten eine „buy-and-hold“ Anlagestrategie?

Handeln mit Twitter Day Index

Im Experiment wurden verschiedene Handelsstrategien getestet und die nachfolgende Abbildung zeigt den entsprechenden Twitter Stimmungsindikator pro Tag und die Kursentwicklung der Aktie Bank of America (BAC).

 

 

Wenn der Twitter Day Index einen oberen Schwellenwert überschritt, wurde ein Kauf-Signal erzeugt und ein Verkauf-Signal beim unteren Schwellenwert. In der Zwischenzeit wurde die Position gehalten. Durch das Variieren der Schwellenwerte (upper / lower threshold) wurden mehrere Stimmungslevel getestet. Um die Rendite zu vergleichen, wurde ein Portfolio aus den vier verschiedenen Aktientiteln kreiert und mit Hilfe des Stimmungsindex gehandelt. Die Handelsstrategie mit Twitter Day Index erzielte einen Return on Investment (ROI) von 1.07% und die buy-and-hold Anlagestrategie -0.25% (ROI).

Stimmungsindikator pro Minute – Handeln mit Twitter Minute Index

Neben der Handelsstrategie basierend auf der Tagesstimmung, wurde ebenfalls die Stimmung pro Minute im Twitter Index erfasst und damit gehandelt. Die nachfolgende Abbildung zeigt einen Ausschnitt des analysierten Zeitraums und illustriert wie der Twitter Index pro Minute häufiger zwischen nur negativen (0) oder nur positiven (1) Twitter Nachrichten schwankt – beim Twitter Day Index ist das nicht der Fall, da pro Tag nicht nur positive oder nur negative Tweets vorhanden waren.

 

 

Diese Schwankungen führen dazu, dass mehr Kauf- und Verkaufssignale ausgelöst werden und damit mit höheren Transaktionskosten verbunden ist. Um Transaktionskosten, aber auch „Noise“, zu reduzieren, wurde der Twitter Minute Index geglättet (MA – Moving Average). Die nachfolgende Abbildung zeigt einen Teilausschnitt aus der Handelsstrategie mit dem geglätteten Stimmungsindex (Durchschnittswerte der letzten 15 Minuten) für die Aktie BAC.

 

 

Während der Backtesting-Phase erzielte die Handelsstrategie mit Hilfe des Twitter Minute Index (Moving Average 15 Minuten), inklusive 10 USD pro Transaktion, ein ROI von 18.8% (buy-and-hold -0.25%).

Für mich war es interessant zu testen ob eine Handelsstrategie basierend auf Twitter Daten eine einfache buy-and-hold Strategie schlägt, aber noch viel spannender waren die Beobachtungen, dass gerade die Aktientitel innerhalb des Portfolios bessere Renditen lieferten, welche weniger Tweets hatten. Dies hängt damit zusammen, dass Aktien welche viele Tweets haben auch mehr „noise“ enthalten und dadurch die Stimmung verzerrt. Eine weitere interessante Beobachtung war, dass die Wahl des Stimmungslevels beziehungsweise die Kombination der Schwellenwerte (rote Linie in den Abbildungen) zu unterschiedlichen Renditen geführt hat. Auf die abschliessende Frage – welche Aktientitel und Schwellenwerte die beste Performance liefert – benötigt man einen längeren Untersuchungszeitraum (Backtesting), mehr Aktientitel und Twitter-Ressource.

Ich bin überzeugt, dass Sentiment Analysis zu einer bestehenden Handelsstrategie gewinnbringend eingesetzt werden kann. Für eine erfolgreiche Handelsstrategie wären weiterführende, relevante Fragesellungen in diesem Zusammenhang sicherlich dabei:

  • Welche Aktien eignen sich für eine Sentiment Handelsstrategie – Growth vs. Value Stocks?
  • Ist die Suche nach bestimmten Wortkombination wie zum Beispiel „buy $AAPL“ oder „sell $AAPL“ im Vergleich zu der ein Wort-Suche gewinnbringender?
  • Sind jene Tweets mit einer bestimmten Anzahl Followers wichtiger?

 

Machine learning wird nur zu Machine earning, wenn der Mensch die passenden Inputfaktoren einsetzt.

Share.

Leave A Reply

%d Bloggern gefällt das: