Product

Eine Kurzanleitung zur Identifizierung von Twitterbots mithilfe von KI

Ankit Singh
December 15, 2017
mins read
Ready to get Started?
request A Demo

In einem unserer letzten Blogbeitrag, wir haben besprochen, wie „gefälschte Konten“ oder „potenzielle Spammer“ auf Twitter identifiziert werden können. Es ist wichtig, solche Informationen herauszufiltern, um möglichst zuverlässige und genaue Erkenntnisse zu erhalten. Viele Unternehmen und Einzelpersonen haben das Spiel weiterentwickelt und Twitterbots verwendet, um die Bereitstellung von Inhalten zu automatisieren und zu beschleunigen. EIN studieren Schätzungen zufolge kann die Anzahl der aktiven Bots auf Twitter bis zu 15% der Gesamtnutzer ausmachen.

Ursprünglich wurden Twitterbots entwickelt, um den menschlichen Aufwand zu reduzieren. Nehmen Netflix-Bot für ein Beispiel. Es twittert, wenn eine neue Sendung oder ein neuer Film auf Netflix hinzugefügt wird.

Twitterbots

Es gibt auch einige außergewöhnliche. Zum Beispiel hat jemand eine sehr intelligente Online-Version des Big Ben erstellt, die das Verstreichen jeder Stunde markiert, wie im folgenden Tweet gezeigt. Jetzt, wo die Menschheit immer mehr Zeit online verbringt, wäre es nur eine Frage der Zeit, bis auch unsere Monumente online präsent sind:).

BONG BONG BONG BONG BONG BONG BONG BONG
— Großer Ben (@big_ben_clock) 15. Mai 2017

Es gibt jedoch eine große Herde von Twitterbots, die eine große Menge an bösartigen und Spam-Inhalten auf der Plattform veröffentlichen. Ich bin sicher, dass Sie auch einige in Ihrer Follower-Liste finden können. Laut Wikipedia spielten Bots auch bei den US-Präsidentschaftswahlen 2016 eine Rolle.

Die Rolle von TwitterBots bei den US-Präsidentschaftswahlen

Eine Untergruppe von Twitter-Bots, die darauf programmiert sind, soziale Aufgaben zu erledigen, spielte bei den Präsidentschaftswahlen in den Vereinigten Staaten 2016 eine wichtige Rolle. Untersuchungen zufolge generierten Trump-Bots vier Tweets für jedes automatisierte Pro-Clinton-Konto und übertrafen Pro-Clinton-Bots während der Abschlussdebatte mit 7:1 auf relevanten Hashtags. Täuschende Twitter-Bots haben Kandidaten und Wahlkampfmitarbeiter dazu verleitet, widerrechtlich angeeignete Zitate und Accounts, die mit aufrührerischen Idealen in Verbindung stehen, zu retweeten.
-Wikipedija

Twitterbots und Spammer versuchen, die Ansichten anderer Nutzer zu verschleiern, indem sie ständig falsche Nachrichten und Meinungen verbreiten. Da keine menschliche Anstrengung erforderlich ist, können Bots unermüdlich über ein Thema twittern und dazu beitragen, dass es zum Trend wird. Für einen politischen Analysten, Marktforscher oder alle anderen, die mithilfe sozialer Medien eingehende Analysen durchführen möchten, ist es wichtig, diese Bots zu identifizieren und herauszufiltern, um echte, unvoreingenommene Meinungen zu erhalten.

Die Hypothese

Die Idee hinter unserem KI-gestützten Ansatz zur Identifizierung von Bots in sozialen Medien basiert auf dieser Hypothese: „Tweets von Bots beziehen sich auf ein sehr enges Thema/einen sehr engen Kontext, während die Tweets von Menschen viel vielfältiger sind“.

Wie haben wir das gemacht?

Um diesen Ansatz zur automatischen Identifizierung von Bots zu verwenden, haben wir die neuesten Tweets einer großen Stichprobe von Twitter-Konten gecrawlt. Für jeden Account haben wir den Tweet-Text in Vektoren umgewandelt und die Ähnlichkeit berechnet, indem wir die durchschnittlichen Entfernungswerte für diese Tweets überprüft haben. Wir haben dafür gesorgt, dass die Stichprobe der Accounts unterschiedlich war.

Wenn ein Handler Tweets zum gleichen Thema und Thema behandelt, werden die Tweets (einzelne Datenpunkte) aufgrund der semantischen Ähnlichkeit eng im Hyperraum platziert. Diese dicht beieinander liegenden ähnlichen Tweets bilden einen Cluster. Wir können die Ähnlichkeit quantifizieren, indem wir den Kosinusabstand zwischen zwei beliebigen Datenpunkten berechnen.

Twitterbots

Die folgende Tabelle stellt die Ergebnisse der Analyse dar. Hier ist die mittlere Entfernung der Durchschnitt aller Kosinusabstände zwischen den einzelnen Datenpunkten. Je geringer die mittlere Entfernung, desto ähnlicher sind die Tweets. Das kannst du natürlich aus der Tabelle ableiten. Der oben erwähnte Big Ben Bot hat die niedrigste mittlere Entfernung unter den Auserwählten, da seine Beiträge nur das Wort „BONG“ enthalten.

Twitterbots
Tabelle mit mittlerer Entfernung

Im Allgemeinen folgen solche Handles einer standardisierten Struktur, um Nachrichten zu posten. Daher hat es eine relativ geringere mittlere Entfernung. (führender indischer Nachrichtenverlag) Wir haben auch einige „Spammer“ -Konten ausgewählt, um den Unterschied zwischen einem Bot und einem Spammer hervorzuheben. Die Spammer posten von Zeit zu Zeit über mehrere Themen, aber Bots posten im Allgemeinen über ein bestimmtes Thema (Wir haben eine ähnliche Analyse durchgeführt, um das Konto eines Spammern zu erkennen. Du kannst es dir ansehen)Zu den indischen Nachrichten. Daher ist ihre mittlere Entfernung weitaus größer als die des Bots. Beachten Sie, dass die mittlere Entfernung von

Auswirkungen von Bots auf die reale Welt

Ich liste einige Fälle auf, in denen Twitterbots einflussreich waren und warum es wichtig ist, sie zu identifizieren.

  • Die Anzahl der Follower in den sozialen Medien gilt als Beliebtheitskennzahl für Prominente. Aber ist es das wirklich? Wie bereits erwähnt, sind rund 15% der Twitter-Nutzer möglicherweise Bots. Daher ist die Anzahl der Follower kein konkreter Maßstab für die Beliebtheit. Bei den US-Präsidentschaftswahlen 2012 war es berichtet Das Barack Obamas 29,9% der Follower könnten Bots/Fake sein, und diese Zahl für Mitt Romney lag bei etwa 21,9%. Die Anzahl der Follower nach dem Entfernen von Bots und Spammern kann als bessere Popularitätskennzahl dienen.
  • Twitterbots haben nach eigenen Angaben die Meinung der Wähler beeinflusst, indem sie während der US-Präsidentschaftswahlen 2016 tonnenweise Trump-Inhalte tweeten und retweeten. Wie bereits erwähnt, Pro-Trump-Bots generierten vier Tweets für jedes automatisierte Pro-Clinton-Konto und übertwitterten Pro-Clinton-Bots während der Abschlussdebatte mit 7:1 auf relevanten Hashtags. Einige der von diesen Bots geteilten Inhalte waren falsch und täuschend. Daher wird es wirklich wichtig, diese Bots eindeutig zu identifizieren, um nur von echten Personen Ansichten und Meinungen zu erhalten.
  • Bei den kürzlich abgeschlossenen französischen Präsidentschaftswahlen waren auch Bots beteiligt. Kurz vor der Wahl wurden riesige 9 GB an geheimen Wahlkampfdokumenten im Zusammenhang mit Emmanuel Macron online gestellt. Twitterbots posteten weiter darüber und halfen dabei, das Thema noch Stunden vor der Wahl zu einem Trendthema zu machen. Es scheint jedoch kaum Auswirkungen auf das Ergebnis gehabt zu haben, da Macron bequem gewonnen hat (was wir mithilfe von KI richtig vorhergesagt haben).
  • Angenommen, eine Marke beauftragt eine Marketingagentur mit einer Werbekampagne. Um die Wirksamkeit der Kampagne beurteilen zu können, ist es jedoch wichtig zu verstehen, ob die Viralität der Kampagne auf Spammer/Bots zurückzuführen ist. In diesem Fall könnte sich dies negativ auf die Marke auswirken und die Marke wird dem Irrtum einer erhöhten Anzahl von Followern ausgesetzt sein. Diese Bots sind nicht die echten Kunden. Somit ist es für die Marke von beiden Seiten ein Verlust.

Dies sind einige bemerkenswerte Orte, an denen Bots die Ansichten des Publikums beeinflusst haben. Obwohl Bots für eine bessere Rolle in den sozialen Medien gedacht sind, werden sie jetzt hauptsächlich als Spam auf Twitter ins Visier genommen. Social-Media-Plattformen werden ständig optimiert, um gegen solche Bedrohungen vorzugehen. Wie jede andere Technologie können Bots Ihnen, wenn sie ethisch eingesetzt werden, in vielerlei Hinsicht helfen. Es kann Ihnen bei der Kundenbetreuung, im Marketing und bei der allgemeinen Geschäftsentwicklung helfen. Interessante Zeiten liegen vor uns, da die Zukunft die Tür zur Ära der maschinellen Intelligenz bereithält. Es liegt an intelligenten KI-Algorithmen, uns dabei zu helfen, Spam, Bots und gefälschte Inhalte von Social-Media-Plattformen auslaufen zu lassen.

In einem unserer letzten Blogbeitrag, wir haben besprochen, wie „gefälschte Konten“ oder „potenzielle Spammer“ auf Twitter identifiziert werden können. Es ist wichtig, solche Informationen herauszufiltern, um möglichst zuverlässige und genaue Erkenntnisse zu erhalten. Viele Unternehmen und Einzelpersonen haben das Spiel weiterentwickelt und Twitterbots verwendet, um die Bereitstellung von Inhalten zu automatisieren und zu beschleunigen. EIN studieren Schätzungen zufolge kann die Anzahl der aktiven Bots auf Twitter bis zu 15% der Gesamtnutzer ausmachen.

Ursprünglich wurden Twitterbots entwickelt, um den menschlichen Aufwand zu reduzieren. Nehmen Netflix-Bot für ein Beispiel. Es twittert, wenn eine neue Sendung oder ein neuer Film auf Netflix hinzugefügt wird.

Twitterbots

Es gibt auch einige außergewöhnliche. Zum Beispiel hat jemand eine sehr intelligente Online-Version des Big Ben erstellt, die das Verstreichen jeder Stunde markiert, wie im folgenden Tweet gezeigt. Jetzt, wo die Menschheit immer mehr Zeit online verbringt, wäre es nur eine Frage der Zeit, bis auch unsere Monumente online präsent sind:).

BONG BONG BONG BONG BONG BONG BONG BONG
— Großer Ben (@big_ben_clock) 15. Mai 2017

Es gibt jedoch eine große Herde von Twitterbots, die eine große Menge an bösartigen und Spam-Inhalten auf der Plattform veröffentlichen. Ich bin sicher, dass Sie auch einige in Ihrer Follower-Liste finden können. Laut Wikipedia spielten Bots auch bei den US-Präsidentschaftswahlen 2016 eine Rolle.

Die Rolle von TwitterBots bei den US-Präsidentschaftswahlen

Eine Untergruppe von Twitter-Bots, die darauf programmiert sind, soziale Aufgaben zu erledigen, spielte bei den Präsidentschaftswahlen in den Vereinigten Staaten 2016 eine wichtige Rolle. Untersuchungen zufolge generierten Trump-Bots vier Tweets für jedes automatisierte Pro-Clinton-Konto und übertrafen Pro-Clinton-Bots während der Abschlussdebatte mit 7:1 auf relevanten Hashtags. Täuschende Twitter-Bots haben Kandidaten und Wahlkampfmitarbeiter dazu verleitet, widerrechtlich angeeignete Zitate und Accounts, die mit aufrührerischen Idealen in Verbindung stehen, zu retweeten.
-Wikipedija

Twitterbots und Spammer versuchen, die Ansichten anderer Nutzer zu verschleiern, indem sie ständig falsche Nachrichten und Meinungen verbreiten. Da keine menschliche Anstrengung erforderlich ist, können Bots unermüdlich über ein Thema twittern und dazu beitragen, dass es zum Trend wird. Für einen politischen Analysten, Marktforscher oder alle anderen, die mithilfe sozialer Medien eingehende Analysen durchführen möchten, ist es wichtig, diese Bots zu identifizieren und herauszufiltern, um echte, unvoreingenommene Meinungen zu erhalten.

Die Hypothese

Die Idee hinter unserem KI-gestützten Ansatz zur Identifizierung von Bots in sozialen Medien basiert auf dieser Hypothese: „Tweets von Bots beziehen sich auf ein sehr enges Thema/einen sehr engen Kontext, während die Tweets von Menschen viel vielfältiger sind“.

Wie haben wir das gemacht?

Um diesen Ansatz zur automatischen Identifizierung von Bots zu verwenden, haben wir die neuesten Tweets einer großen Stichprobe von Twitter-Konten gecrawlt. Für jeden Account haben wir den Tweet-Text in Vektoren umgewandelt und die Ähnlichkeit berechnet, indem wir die durchschnittlichen Entfernungswerte für diese Tweets überprüft haben. Wir haben dafür gesorgt, dass die Stichprobe der Accounts unterschiedlich war.

Wenn ein Handler Tweets zum gleichen Thema und Thema behandelt, werden die Tweets (einzelne Datenpunkte) aufgrund der semantischen Ähnlichkeit eng im Hyperraum platziert. Diese dicht beieinander liegenden ähnlichen Tweets bilden einen Cluster. Wir können die Ähnlichkeit quantifizieren, indem wir den Kosinusabstand zwischen zwei beliebigen Datenpunkten berechnen.

Twitterbots

Die folgende Tabelle stellt die Ergebnisse der Analyse dar. Hier ist die mittlere Entfernung der Durchschnitt aller Kosinusabstände zwischen den einzelnen Datenpunkten. Je geringer die mittlere Entfernung, desto ähnlicher sind die Tweets. Das kannst du natürlich aus der Tabelle ableiten. Der oben erwähnte Big Ben Bot hat die niedrigste mittlere Entfernung unter den Auserwählten, da seine Beiträge nur das Wort „BONG“ enthalten.

Twitterbots
Tabelle mit mittlerer Entfernung

Im Allgemeinen folgen solche Handles einer standardisierten Struktur, um Nachrichten zu posten. Daher hat es eine relativ geringere mittlere Entfernung. (führender indischer Nachrichtenverlag) Wir haben auch einige „Spammer“ -Konten ausgewählt, um den Unterschied zwischen einem Bot und einem Spammer hervorzuheben. Die Spammer posten von Zeit zu Zeit über mehrere Themen, aber Bots posten im Allgemeinen über ein bestimmtes Thema (Wir haben eine ähnliche Analyse durchgeführt, um das Konto eines Spammern zu erkennen. Du kannst es dir ansehen)Zu den indischen Nachrichten. Daher ist ihre mittlere Entfernung weitaus größer als die des Bots. Beachten Sie, dass die mittlere Entfernung von

Auswirkungen von Bots auf die reale Welt

Ich liste einige Fälle auf, in denen Twitterbots einflussreich waren und warum es wichtig ist, sie zu identifizieren.

  • Die Anzahl der Follower in den sozialen Medien gilt als Beliebtheitskennzahl für Prominente. Aber ist es das wirklich? Wie bereits erwähnt, sind rund 15% der Twitter-Nutzer möglicherweise Bots. Daher ist die Anzahl der Follower kein konkreter Maßstab für die Beliebtheit. Bei den US-Präsidentschaftswahlen 2012 war es berichtet Das Barack Obamas 29,9% der Follower könnten Bots/Fake sein, und diese Zahl für Mitt Romney lag bei etwa 21,9%. Die Anzahl der Follower nach dem Entfernen von Bots und Spammern kann als bessere Popularitätskennzahl dienen.
  • Twitterbots haben nach eigenen Angaben die Meinung der Wähler beeinflusst, indem sie während der US-Präsidentschaftswahlen 2016 tonnenweise Trump-Inhalte tweeten und retweeten. Wie bereits erwähnt, Pro-Trump-Bots generierten vier Tweets für jedes automatisierte Pro-Clinton-Konto und übertwitterten Pro-Clinton-Bots während der Abschlussdebatte mit 7:1 auf relevanten Hashtags. Einige der von diesen Bots geteilten Inhalte waren falsch und täuschend. Daher wird es wirklich wichtig, diese Bots eindeutig zu identifizieren, um nur von echten Personen Ansichten und Meinungen zu erhalten.
  • Bei den kürzlich abgeschlossenen französischen Präsidentschaftswahlen waren auch Bots beteiligt. Kurz vor der Wahl wurden riesige 9 GB an geheimen Wahlkampfdokumenten im Zusammenhang mit Emmanuel Macron online gestellt. Twitterbots posteten weiter darüber und halfen dabei, das Thema noch Stunden vor der Wahl zu einem Trendthema zu machen. Es scheint jedoch kaum Auswirkungen auf das Ergebnis gehabt zu haben, da Macron bequem gewonnen hat (was wir mithilfe von KI richtig vorhergesagt haben).
  • Angenommen, eine Marke beauftragt eine Marketingagentur mit einer Werbekampagne. Um die Wirksamkeit der Kampagne beurteilen zu können, ist es jedoch wichtig zu verstehen, ob die Viralität der Kampagne auf Spammer/Bots zurückzuführen ist. In diesem Fall könnte sich dies negativ auf die Marke auswirken und die Marke wird dem Irrtum einer erhöhten Anzahl von Followern ausgesetzt sein. Diese Bots sind nicht die echten Kunden. Somit ist es für die Marke von beiden Seiten ein Verlust.

Dies sind einige bemerkenswerte Orte, an denen Bots die Ansichten des Publikums beeinflusst haben. Obwohl Bots für eine bessere Rolle in den sozialen Medien gedacht sind, werden sie jetzt hauptsächlich als Spam auf Twitter ins Visier genommen. Social-Media-Plattformen werden ständig optimiert, um gegen solche Bedrohungen vorzugehen. Wie jede andere Technologie können Bots Ihnen, wenn sie ethisch eingesetzt werden, in vielerlei Hinsicht helfen. Es kann Ihnen bei der Kundenbetreuung, im Marketing und bei der allgemeinen Geschäftsentwicklung helfen. Interessante Zeiten liegen vor uns, da die Zukunft die Tür zur Ära der maschinellen Intelligenz bereithält. Es liegt an intelligenten KI-Algorithmen, uns dabei zu helfen, Spam, Bots und gefälschte Inhalte von Social-Media-Plattformen auslaufen zu lassen.