Saturday, November 5, 2016

Handelsstrategien Zu Blog Und News Sentiment Exploit

Ähnliche Publikationen Handelsstrategien zu Blog und News Sentiment Exploit Wenbin Zhang und Steven Skiena Institut für Informatik, Stony Brook University Stony Brook, NY 11794-4400 USA Wir verwenden quantitative Medien (Blogs und News zum Vergleich) Daten, die von einer groß angelegten Verarbeitung natürlicher Sprache erzeugt (NLP) Textanalysesystem ein umfassendes durchzuführen und vergleichende Studie darüber, wie berichtet, die ein Unternehmen Medien Fre - quenz, Stimmung Polarität und Subjektivität rechnet oder Wieder spiegelt der Aktienhandelsvolumen und die finanziellen Erträge. Unser Analyse liefert konkrete Hinweise, dass Mediendaten ist hoch informativ, wie zuvor in der Literatur vorgeschlagen - jedoch nie auf unserer Skala von mehreren großen Sammlungen von Blogs untersucht und Nachrichten für mehr als fünf Jahren. Aufbauend auf unseren Erkenntnissen, die wir geben ein Gefühl basierenden marktneutrale Handelsstrategie, gibt durchweg günstigen Erträge mit geringer Volatilität ein Zeitraum von fünf Jahren (2005-2009). Unsere Ergebnisse sind in signifikanten Bestätigung der Leistungsfähigkeit der allgemeinen Blog und News Sensoren timent Analysemethoden über weite Bereiche und Quellen. Darüber hinaus einige bemerkenswerte Unterschiede zwischen Nachrichten und Blogs werden auch in diesem Papier identifiziert. Einführung Die Effizienzmarkthypothese behauptet, dass Finanzmarkt Märkte sind "informationseffizienten", die aktuelle bedeutet Aktienkurse spiegeln bereits alle bekannten Informationen und alle aufgetreten Fakten. Darüber hinaus sind die Preise in Finanzmärkte un - voreingenommen und enthalten alle Weisheit und zukünftige Prognosen Anleger. Daher können die Anleger nicht überschüssige prof - machen ihre aus dem Markt, wenn ihre Trading-Strategien basieren auf bekannten Informationen, da die Marktpreise effizient Sammeln und Aggregieren verschiedene Informationen und halten Änderung unverzüglich. Jedoch eine große und wachsende Literatur Dokumente, Bewegungen der Finanzkennzahlen sind nicht immer konse - Zelt mit den quantitativen Maßnahmen von grundlegender Unternehmen ' tals (zB (Cutler, Poterba und Summers 1989; Roll-1988; c. 2010 Vereinigung für die Förderung der Künstlichen Intelligence (VZK). Alle Rechte vorbehalten. könnte eine machbare und nützliche Art und Weise zu analysieren, Finanz liefern Unser primäres Ziel ist es, die Beziehung zwischen studieren Börsendaten und sprachlichen Mediendaten, beide Blogs und Nachrichten, andtoillustratetheextenttowhichtheycancontribute der Gestaltung der Anlagestrategien. Unser Hauptbeitrag gen in dieser Veröffentlichung sind: • Vergleichende Studie von Blogs und News - Wir führen ein nachdenklich vergleichende Untersuchung der vier verschiedenen sprachlichen tic Quellen, dh Twitter, Spinn3r RSS Blogs LiveJour - nal Blogs und News Dailies als Vergleich. Wir Kom - pare ihre Gefühle mit entsprechenden Aktien und Auswer - Uate der Equity-Trading-Performance mit Hilfe der vier Quellen sind. Unsere Analyse entdeckt auch viele unterschiedliche Eigenschaften zwischen Blogs und News. Beispielsweise, News Informationen könnten in die Aktienkurse eingearbeitet werden sofort (fast innerhalb von 1 Tag) nach der Entlassung, während Blog Informationen wie Twitter werden von Börse aufgenommen werden mit einem längeren Zeitraum (etwa 2 bis 3 Tage). • Groß Analyse - Wir geben umfassende Ergebnisse Analyse Aktienmarkt mit rund einem Terabyte Blog und Nachrichtendaten und Tausenden von verschiedenen Unternehmen. Dies Skala von Analyse war noch nie zuvor in Versuch der Literatur, andenablesustoidentifyshort-termbutsta - tistically signifikante Korrelationen zwischen Mediavolumen / Stimmung und finanzielle Erträge / Handelsvolumina. • Corpus Size Matters - Frühere Arbeiten auf die Stimmung basierende Finanzanalyse (zB (Tetlock, Saar-Tsechansky und Macskássy 2007)) konzentrieren sich ausdrücklich auf die nationalen Finanz Zeitungen, nämlich die Dow Jones News Service und die Wallstreet Journal. Allerdings wedemonstratethatamore deutliche, zuverlässige Stimmungssignal kommt von Ana - • Validierung von Sentiment Analysis Methods - Vielleicht an - anderen wichtigen Beitrag unserer Arbeit ist die stärkste Validierung auf dem neuesten Stand der Genauigkeit unserer Medienstimmung Analysemethodik von Lydia. Proper Validierung ist Im - möglich, in der Abwesenheit von irgendeinem vereinbarten Goldstandard für Entity-Level-Sentiment-Analyse (Pang und Lee 2008). Aber unsere Fähigkeit, eine hinreichend sichere Gefühl zu extrahieren Signal für die erfolgreich auf (Handel unabhängig von Zeit Auflösung) bietet rigorose Beweis dafür, dass unsere Stimmung Verfahren realen Veränderungen genau widerspiegeln als Reaktion auf LIN - sprachlichen Informationen. Dieses Papier ist wie folgt aufgebaut. Zuerst überprüfen wir Wieder rechnet Arbeit. Wir beschreiben dann den Ursprung und die Eigenschaften der Medien und Finanzdaten mit denen wir arbeiten. Danach wir geben eine vollständige Analyse der Korrelation zwischen Haupt Aktienmarktvariablen und großen Medien-Variablen, das ist, der wichtigste Teil dieser Veröffentlichung. Schließlich schlagen wir vor, und zu bewerten eine marktneutrale Handelsstrategie auf Basis von Me - dia-Daten. Wir schließen daraus, dass die Finanz Preise sind deutlich quantitative Mediendaten korreliert und können verwendet werden, formulieren interessante Trading-Strategien. Verwandte Arbeiten Frühere Arbeiten zwischen dem Finanz - und Computer unterteilt Wissenschaft akademischen Gemeinschaften. Wir ersten Umfrageforschung aus der Finanz Reich. Tetlock (Tetlock, Saar-Tsechansky und Macskássy 2007) untersucht, ob das Auftreten von negativen Wörter firmenspezifische Nachrichten Artikel können uns helfen, Geld der Unternehmen vorauszusagen fließt und ob der Unternehmen Börsenkurse übernehmen sprachlichen Informationen effizient. Sie behaupten, dass die Unternehmen " Aktienkurse auf den zugrunde liegenden negativen Informationen unter reagieren tion der News-Artikel. Genauer negativen Informations tion in News-Artikel werden in den Börsenkursen mit reflektiertem etwa einem Tag Verzögerung. Chan (Chan 2003) untersucht Monatsrenditen auf eine Teilmenge der Aktien nach dem öffentlichen Nachrichten über sie freigesetzt und findet dass die Anleger langsam reagieren, um Informationen, vor allem nach schlechte Nachrichten. Eine weitere wichtige Erkenntnis ist, dass Aktien neigen dazu, Rückwärts im Folgemonat nach dem extremen Preisbewegungen rungen ohne Begleitung von öffentlichen Nachrichten. Darüber hinaus sind diese Muster sind statistisch signifikant. Eine Einschränkung bei dieser Studie verwendet grob, monatliche Granularität. In unserem Papier, wir bieten Analyse der täglichen Nachrichten und Kursbewegungen. Antweiler und Frank (Antweiler und Frank 2004) Studium mehr als 1,5 Millionen Nachrichten von Yahoo! Finanzen und Raging Bull, die die beiden beliebtesten Internet Stock sind Schwarzes Brett. Sie beschäftigt Naive Bayes und Support Vector Machine Klassifizierer zu "Optimismus" Inhalt der Beurteilung diese Lager-Nachrichten. Sie zeigen diese Message Boards sind recht informativ, und ferner, daß Optimismus positiv und signifikant mit Renditen verbunden. In Bezug auf den Handel Volumen, das Papier zeigt kontroverse Meinungen sind assoziierten ated mit mehr Trades. Von der Informatik Seite sind intensive Forschungen von Text Mining oder Maschinenlerngemeinschaften geliefert. Deren Grundidee ist, sprachliche Informationen zu quantifizieren Text-Mining-Techniken, nutzen Sie die vordefinierten Satz von Eigenschaften die Trainingsdaten, und erstellen Sie dann verschiedene Modelle mit klassischen cal statistische Ansätze oder statistische Lernalgorithmen. Eine detaillierte Übersicht über die Text-Mining für die Reaktion des Marktes Nachrichten können in (Mittermayer und Knolmayer gefunden werden 2006a). Insbesondere wird das 3-Kategorie Modell weit verbreitet Dokumente oder Worten zu kennzeichnen. Die erste Kategorie (positive Stimmung) besteht aus Nachrichtenartikeln oder Wörter, die das machen, assoziierten finanziellen Variablen zu erhöhen bis zu einem gewissen Grad in der eine bestimmte Zeitdauer, beispielsweise ein Nachrichtenereignis macht die Preis des Einzelaktien "IBM" zu erhöhen 0,5% in der fol - genden Tag. Auch die zweite Kategorie (negative Sensoren timent) entsprechend definiert. Die dritte Kategorie besteht neutraler Nachrichtenartikel oder Wörter. unter diesem Modell gekennzeichnet (Fung, Yu und Lam 2002; Mittermayer und Knolmayer 2006b; Thomas 2003; Wüthrich, Cho und etc. 1998). Es hat auch wesentliches Interesse an der Meinung Bergbau und NLP-Community auf den Einsatz von Finanz Text-Streams Hier beschreiben wir die Lager und Mediendatenquellen, die ist die Basis für die Analyse in diesem Dokument. Bestandsdaten Unser Aktienkurs und Volumendaten aus Thom - erhalten Mediadaten Unternehmensbezogene Blog und News Daten wurden US - erzeugt ing die Lydia ((Lloyd, Kechagias und Skiena 2005), textmap), einen Hochgeschwindigkeits-Textverarbeitungs Sys-


No comments:

Post a Comment