1 00:00:00,140 --> 00:00:14,856 *Intro Musik* 2 00:00:14,856 --> 00:00:18,720 Herald: Ihr findet das ja wahrscheinlich alle völlig normal mit großen Datenmengen 3 00:00:18,720 --> 00:00:23,710 umzugehen. So Typen wie ich, die herkömmliche Journalisten sind, ich bin im 4 00:00:23,710 --> 00:00:27,339 Hauptberuf Hörfunkjournalist, die verzweifeln regelmäßig daran. Also wir 5 00:00:27,339 --> 00:00:30,790 haben gelernt, damals, Leute zu fragen, die sich mit irgendwas auskennen. 6 00:00:30,790 --> 00:00:33,012 Jetzt ist Leute fragen, die sich mit großen 7 00:00:33,012 --> 00:00:34,890 Datenmengen auskennen auch nicht unbedingt 8 00:00:34,890 --> 00:00:39,800 zielführend für unserein, dafür gibts aber neuerdings einen relativ frischen Beruf, 9 00:00:39,800 --> 00:00:43,800 dieser Beruf nennt sich Datenjournalist. Datenjournalisten sind diese Menschen, die 10 00:00:43,800 --> 00:00:47,140 aus aberwitzig großen Datenmengen Zusammenhänge rauspopeln und diese 11 00:00:47,140 --> 00:00:49,900 Zusammenhänge dann idealerweise auch noch so visualisieren, 12 00:00:49,900 --> 00:00:51,610 dass solche Noobs wie ich das dann 13 00:00:51,610 --> 00:00:54,679 auch verstehen und hinterher kompetent drüber reden können, oder 14 00:00:54,679 --> 00:00:57,829 jedenfalls so aussehen können, als würden sie kompetent drüber reden und einer der 15 00:00:57,829 --> 00:01:01,740 so Leute wie uns sehr dabei unterstützt, ist Datenjournalist. Das ist nämlich der 16 00:01:01,740 --> 00:01:06,341 Michael Kreil und seinen Vortrag seht ihr jetzt. Viel Spaß. 17 00:01:06,341 --> 00:01:16,880 *Applaus* Michael: Guten Morgen. Ihr habt gut 18 00:01:16,880 --> 00:01:23,209 geschlafen, ich nicht, weil erstens halte ich jetzt einen Vortrag vor vielen Leuten 19 00:01:23,209 --> 00:01:27,010 und zum anderen werde ich mich in ein-- mit einem Thema beschäftigen, das zu sehr 20 00:01:27,010 --> 00:01:30,640 hitzigen Debatten und Shitstorms geführt hat und da möchte ich auch nicht im 21 00:01:30,640 --> 00:01:36,860 Zentrum sein. Deswegen ist auch meine erste Folie der Disclaimer. Ich würde mich 22 00:01:36,860 --> 00:01:40,840 politisch als links einordnen. Ich distanziere mich hiermit ausdrücklich 23 00:01:40,840 --> 00:01:44,950 gegen jegliche Form von Rassismus, Sexismus, Antisemitismus, 24 00:01:44,950 --> 00:01:48,430 Fremdenfeindlichkeit, Islamfeindlichkeit und allgemein gegen jede Form von 25 00:01:48,430 --> 00:01:56,929 gruppenbezogener Menschlichkeit (*Applaus*) - Menschenfeindlichkeit. Und im Rahmen 26 00:01:56,929 --> 00:02:00,229 dieses Vortrags bin ich Wissenschaftler und Beobachter einer hitzigen 27 00:02:00,229 --> 00:02:04,080 Gesellschaftsdebatte und sehe mich somit der Neutralität verpflichtet. Ich möchte 28 00:02:04,080 --> 00:02:07,800 die Debatte beobachten und nicht Teil von ihr sein. Es geht also nicht um meine 29 00:02:07,800 --> 00:02:12,080 politische Position sondern um eine neutrale Analyse von Daten. Und dafür habe 30 00:02:12,080 --> 00:02:17,090 ich mal 150 Folien vorbereitet. Ich hab den Übersetzungsengeln schon Bier 31 00:02:17,090 --> 00:02:23,030 versprochen. Ähm ... genau, dann lass uns direkt reinschmeißen. Das erste ist die 32 00:02:23,030 --> 00:02:27,590 Methodik. Das möchte ich gerne nochmal vorher erzählen, damit die Leute auch 33 00:02:27,590 --> 00:02:31,658 wissen, wie es funktioniert und mir ist es auch wichtig, dass es reproduzierbar ist. 34 00:02:31,658 --> 00:02:37,850 Es gibt ne Twitter-API, in der man Status und Tweets abfragen kann, 35 00:02:37,850 --> 00:02:40,946 User abfragen kann, welche Listen veröffentlicht wurden. 36 00:02:40,946 --> 00:02:43,740 Man kann danach suchen, gucken, welche Follower sie haben 37 00:02:43,740 --> 00:02:47,164 und so weiter und so fort. Dann setzt man sich hin und dann baut man sich 38 00:02:47,164 --> 00:02:50,650 son Interface für die API, wenn man sich ein bisschen Mühe gibt, packt man 39 00:02:50,650 --> 00:02:54,430 auch noch einen Cache dazwischen. Das heißt wenn ich Anfragen an die Twitter-API 40 00:02:54,430 --> 00:02:57,780 stelle und eine Anfrage kommt zweimal, dann holt er sie aus der 41 00:02:57,780 --> 00:03:02,629 Datenbank und so weiter. Und wenn man sich richtig Mühe gibt und vielleicht auch ein 42 00:03:02,629 --> 00:03:07,730 paar Tage oder Wochen investiert, dann skaliert man das in einer Art und Weise, 43 00:03:07,730 --> 00:03:11,770 dass man nicht ein Interface hat, sondern ganz viele und jedes Einzelne davon steht 44 00:03:11,770 --> 00:03:15,710 für einen anderen Twitter-Nutzer. Die Idee ist, dass ich nicht als einzelner Nutzer 45 00:03:15,710 --> 00:03:19,489 abfrage, sondern ganz viele Nutzer können parallel die Twitter-API abfragen. Und 46 00:03:19,489 --> 00:03:25,909 darüber gibt es so eine Art Load-Balancer, der guckt ob-- sozusagen, wie die Last 47 00:03:25,909 --> 00:03:30,650 verteilt wird. Ziel der Aktion ist, die Twitter API ist nämlich limitiert. Ich 48 00:03:30,650 --> 00:03:34,439 kann wenn ich zum Beispiel wissen möchte, wer wie wem folgt, darf ich pro Minute 49 00:03:34,439 --> 00:03:39,940 durchschnittlich nur eine Anfrage stellen. Wenn aber ich von ganz vielen Leuten die 50 00:03:39,940 --> 00:03:44,470 Autorisierung habe, in deren Namen Anfragen zu stellen, darf ich entsprechend 51 00:03:44,470 --> 00:03:48,470 mehr Anfragen stellen. Das ist so eine Art demokratischer Prozess, finde ich da drin, 52 00:03:48,470 --> 00:03:53,970 dass die Ressourcen von Twitter aufgeteilt werden. Umso mehr Leute mich bei meiner 53 00:03:53,970 --> 00:03:58,010 API-Anfrage unterstützen, um so mehr Anfragen darf ich machen und umso mehr 54 00:03:58,010 --> 00:04:02,409 Last darf ich verursachen. Finde ich sehr spann-- sympathisch. Mein Kollege jetzt 55 00:04:02,409 --> 00:04:06,360 hat dann mal ein Interface aufgebaut, wo man einen Token spenden kann. Da klickt 56 00:04:06,360 --> 00:04:10,120 man da halt drauf und dann kriegt man-- kriegen wir sozusagen einen langen Code, 57 00:04:10,120 --> 00:04:13,840 der uns dann ermöglicht zusätzliche Anfragen an die API von Twitter zu 58 00:04:13,840 --> 00:04:18,880 stellen. Großes Danke geht hier nochmal an Logbuch Netzpolitik, insbesondere Tim und 59 00:04:18,880 --> 00:04:23,460 Linus, und natürlich an die fast 700 Spender und Spenderinnen, die uns Tokens 60 00:04:23,460 --> 00:04:29,110 zur Verfügung gestellt haben. Das war not- wendig, um große Datenmengen aus Twitter 61 00:04:29,110 --> 00:04:33,486 herauszuholen. Genau, damit kann ich dann sozusagen ... 62 00:04:33,486 --> 00:04:41,870 *Applaus* Schon bei mir zu Hause kann ich dann über 63 00:04:41,870 --> 00:04:46,390 Kabel Deutschland 10 Requests pro Sekunde absetzen, mal zum Vergleich, wenn ich 64 00:04:46,390 --> 00:04:50,550 jetzt zum Beispiel mal die Metadaten aller 330 Millionen Twitter-Accounts abfragen 65 00:04:50,550 --> 00:04:55,530 möchte, braucht man etwa vier Tage dafür. Das ist dann auch machbar, ohne die Tokens 66 00:04:55,530 --> 00:04:59,890 kann es sich um Monate oder sogar um Jahre handeln. Das mal so ein bisschen erklärt, 67 00:04:59,890 --> 00:05:04,100 technisch, wie das im Hintergrund funktioniert. Im Prinzip auch sehr stark 68 00:05:04,100 --> 00:05:10,110 auf Twitter fokussiert, die Analysen. Genau. Erstes Thema, Fake News. Fake News 69 00:05:10,110 --> 00:05:14,730 ist ein komplexes Thema. Ich habe jetzt mal eine Grafik übernommen von der 70 00:05:14,730 --> 00:05:18,550 Stiftung Neue Verantwortung, ich finde die haben da die besten Kategorisierungen 71 00:05:18,550 --> 00:05:23,290 gemacht, was Fake News sind und was Fake News nicht sind. Auf der linken Seite was 72 00:05:23,290 --> 00:05:27,260 nicht Fake News sind, ist schlechte Politik, also Fake News als politischer 73 00:05:27,260 --> 00:05:31,550 Kampfbegriff, zum Beispiel Trump gegen die New York Times oder so was, aber auch 74 00:05:31,550 --> 00:05:35,581 Satire sind keine Fake News, schlechter Journalismus, Clickbaiting oder auch 75 00:05:35,581 --> 00:05:41,070 Zeitungsenten sollen eigentlich nicht zu Fake News gezählt werden, Fake News sein-- 76 00:05:41,070 --> 00:05:49,760 oder sind gezielte Desinformation, falsch verstandene Inhalte und manipulierte 77 00:05:49,760 --> 00:05:53,320 Inhalte, also oft sieht man, dass zum Beispiel Bilder beschnitten sind oder 78 00:05:53,320 --> 00:06:00,100 retuschiert sind und so weiter oder völlig frei erfundene Inhalte. Ich habe leider 79 00:06:00,100 --> 00:06:03,780 nur ne Stunde Zeit, deswegen kann ich mich jetzt nicht mit mehreren Fake News- 80 00:06:03,780 --> 00:06:07,420 Wellen auseinandersetzen. Deswegen habe ich eine herausgenommen, die ich ganz 81 00:06:07,420 --> 00:06:14,241 typisch und eindrucksvoll fand und zwar die Fake News über eine Reisewarnung nach 82 00:06:14,241 --> 00:06:19,270 Schweden des Auswärtigen Amtes. Hier ist ein Tweet von der AfD Magdeburg, die sagt: 83 00:06:19,270 --> 00:06:22,780 „Das Auswärtige Amt - Erhöhte Terrorwarnstufe für Schweden. Das hat 84 00:06:22,780 --> 00:06:26,640 natürlich nichts mit irgendwas zu tun. Hashtag AfD wählen". Direkt danach-- naja 85 00:06:26,640 --> 00:06:32,700 nicht direkt danach, einige Stunden oder Tage später kam ein Tweet des Auswärtigen 86 00:06:32,700 --> 00:06:37,000 Amtes, die dann die Gegendarstellung veröffentlicht haben: „Es gibt keine 87 00:06:37,000 --> 00:06:42,360 Reisewarnung für Schweden. Hashtag Fake News". Fast 2000 Tweets wurden zu diesem 88 00:06:42,360 --> 00:06:46,290 Thema veröffentlicht und die kann ich jetzt nun mit diesem Twitter-Framework 89 00:06:46,290 --> 00:06:51,340 runterladen, analysieren und mir ein paar Visualisierungen dazu ausdenken. Ich hab 90 00:06:51,340 --> 00:06:56,750 mal die Eine gemacht, das ist jetzt ein Zeitstrahl. Auf der x-Achse sieht man die 91 00:06:56,750 --> 00:07:03,641 Zeit. Hier geht's vom 2. März bis zum-- 0 Uhr bis zum 9. März 0 Uhr. Oben, die 92 00:07:03,641 --> 00:07:08,140 Roten, das sind die Fake News-Verbreiter. Unten, das sind diejenigen, die die 93 00:07:08,140 --> 00:07:11,962 Gegendarstellungen verbreiten. Auf dem Zeitstrahl sind -- viel zu klein, das kann 94 00:07:11,962 --> 00:07:15,632 man jetzt drauf nicht sehen -- der Zeitpunkt, wann ein Tweet veröffentlicht 95 00:07:15,632 --> 00:07:17,310 wurde und wenn er retweetet wurde, 96 00:07:17,310 --> 00:07:18,840 kriegt er sozusagen einen Bogen, 97 00:07:18,840 --> 00:07:20,940 zu dem Zeitpunkt, wohin er retweetet wurde. 98 00:07:20,940 --> 00:07:21,890 Das hat den Vorteil, 99 00:07:21,890 --> 00:07:23,450 dass ich nicht nur sehe, wie viele Tweets 100 00:07:23,450 --> 00:07:25,180 veröffentlicht wurden, sondern auch sehen kann, 101 00:07:25,180 --> 00:07:26,800 welchen Impact dieser Tweet hat. 102 00:07:26,800 --> 00:07:28,970 Wenn er also, zum Beispiel veröffentlicht wird und keiner 103 00:07:28,970 --> 00:07:32,560 geht damit um, dann ist es halt nur ein Punkt, aber wenn es viele Leute retweeten, 104 00:07:32,560 --> 00:07:38,800 gibts dann halt große Bögen dazu. Das-- Den ersten Tweet, den ich finden konnte, 105 00:07:38,800 --> 00:07:44,180 zu der Fake News, dass es eine Reisewarnung nach Schweden gibt, war-- ist 106 00:07:44,180 --> 00:07:49,100 bereits am 28. September veröffentlicht worden, wurde aber nicht beachtet. Keine 107 00:07:49,100 --> 00:07:55,180 Favs, keine Retweets, obwohl der Account aktuell 481 Follower hat. Am--, im Februar 108 00:07:55,180 --> 00:08:01,960 gab es dann nochmal einen Tweet dazu. Der Account hat jetzt aber nur einen Follower 109 00:08:01,960 --> 00:08:05,520 und der Tweet hat keine Retweets. Das heißt also die Themen kamen schon mal 110 00:08:05,520 --> 00:08:11,650 vorher hoch, aber sie wurden nicht weitergetragen. Noch ein Beispiel aus dem 111 00:08:11,650 --> 00:08:16,850 1. März 2017. Also jetzt gehen wir mal rüber zu unserem Zeitstrahl, da gibt's 112 00:08:16,850 --> 00:08:24,570 dann den ersten, der dazu was twittert, einen Screenshot von einem Bot, der 113 00:08:24,570 --> 00:08:29,540 Reisewarnungen veröffentlicht. Der Tweet hat immerhin 6 Tweets und 6 Favs-- 6 114 00:08:29,540 --> 00:08:38,200 Retweets und 6 Favs erreicht und hat damit sozusagen den ersten kleinen Impact. Dann 115 00:08:38,200 --> 00:08:43,970 steigert es sich immer mehr, dann gibt's die Reisewarnung für Schweden mit 29 116 00:08:43,970 --> 00:08:48,460 Retweets. Der nächste Tweet, kann ich leider nicht mehr anzeigen, weil der 117 00:08:48,460 --> 00:08:52,330 Account inzwischen gesperrt wurde, das ist auch ein Phänomen, das man immer wieder 118 00:08:52,330 --> 00:08:56,311 sieht, dass in diesem Bereich Accounts gesperrt werden von Twitter. „Trump hatte 119 00:08:56,311 --> 00:09:02,440 recht, Auswärtiges Amt gibt Reisewarnung für Schweden heraus". Genau, und verweist 120 00:09:02,440 --> 00:09:11,380 auf einen Artikel von zuerst.de. 45 Retweets und es steigert sich immer mehr. 121 00:09:11,380 --> 00:09:20,700 „Doch nicht alles ruhig in Schweden". Holger Ewald. „Islamterror". Und dann zum 122 00:09:20,700 --> 00:09:25,630 Schluss die AfD Magdeburg mit--, die dann aufspringt und dann das erste AfD-Hashtag 123 00:09:25,630 --> 00:09:29,490 dran setzt und „Multikulturell scheint es nicht so richtig zu laufen in Schweden". 124 00:09:29,490 --> 00:09:33,330 Man sieht, dass es eine Steigerung gibt von fängt an mit Reisehinweisen und endet 125 00:09:33,330 --> 00:09:40,000 mit Islamterror. Ich springe jetzt mal ganz weit nach vorne zu den Antworten. 126 00:09:40,000 --> 00:09:44,370 Diejenigen, die also dann die Gegendarstellung veröffentlichen, da 127 00:09:44,370 --> 00:09:48,850 fing's, oder der Startschuss war da das Auswärtige Amt, die in einem-- die dann 128 00:09:48,850 --> 00:09:54,080 erklären, dass es sich um Fake News handelt und relativ schnell springen dann 129 00:09:54,080 --> 00:10:00,560 halt auch die Medien mit auf, die das sozusagen weiterverbreiten. Und zum 130 00:10:00,560 --> 00:10:06,630 Schluss sieht man den gesamten Zeitstrahl nochmal und das Interessante ist dabei, 131 00:10:06,630 --> 00:10:10,960 dass das Thema gar nicht sozusagen, dass ne Fake News veröffentlicht wird und dann 132 00:10:10,960 --> 00:10:14,750 schlägt die total ein und alle sind total empört, sondern man stottert sich 133 00:10:14,750 --> 00:10:18,710 sozusagen förmlich in die Fake News rein. Also es fängt klein an und dann werden sie 134 00:10:18,710 --> 00:10:24,870 nochmal weiter überspitzt und man hat eher den Eindruck, als ob da rumexperimentiert 135 00:10:24,870 --> 00:10:29,790 wird, bis das Netzwerk eine Resonanz hervorruft. Ich würde persönlich 136 00:10:29,790 --> 00:10:34,030 behaupten, Fake News sind eigentlich Meme, die sich im Internet verbreiten. Oft 137 00:10:34,030 --> 00:10:39,180 haben sie keine singuläre Quelle, sondern sie bilden sich erst im Netzwerk oder 138 00:10:39,180 --> 00:10:43,120 anders formuliert, das Kern-Phänomen an Fake News ist nicht deren Existenz, 139 00:10:43,120 --> 00:10:46,831 sondern, dass sie sich so gut verbreiten können, also das Problem ist nicht die 140 00:10:46,831 --> 00:10:52,880 Quelle, die sie erzeugt, sondern dass sie eine so große Resonanz im Netzwerk findet. 141 00:10:52,880 --> 00:10:57,500 Würde man also Fake-News-Quellen verbieten, würden sie trotzdem weiterhin 142 00:10:57,500 --> 00:11:02,271 entstehen, im Netzwerk. Und das ist halt wichtig, da Fake News als Meme eine große 143 00:11:02,271 --> 00:11:06,350 Reichweite haben, kann man aus ihnen Kapital schlagen, politisches oder 144 00:11:06,350 --> 00:11:10,290 monetäres Kapital. Und da möchte ich mal aus dem amerikanischen Raum, zum Beispiel 145 00:11:10,290 --> 00:11:15,680 Breitband News und-- Breitbart News und Trump erwähnen, die monetäres Kapital oder 146 00:11:15,680 --> 00:11:20,280 politisches Kapital daraus schlagen. Aber zurück zu den Reisewarnungen. Man kann 147 00:11:20,280 --> 00:11:25,970 sie nicht nur im zeitlichen Verlauf sich anschauen, sondern man kann tiefer 148 00:11:25,970 --> 00:11:29,380 einsteigen. Man kann halt gucken, welche Accounts haben denn jetzt die 149 00:11:29,380 --> 00:11:33,500 Gegendarstellungen und die Fake News verbreitet und kann gucken, wie die sich 150 00:11:33,500 --> 00:11:41,990 gegenseitig folgen. Und daraus baut man dann so ein Netzwerk. Die Blauen sind die 151 00:11:41,990 --> 00:11:47,000 Gegendarstellungensverbreiter und die Roten sind die Fake-News-Verbreiter. Um so 152 00:11:47,000 --> 00:11:51,060 näher sie grafisch dargestellt werden, umso also-- folgen die sich. Also 153 00:11:51,060 --> 00:11:54,890 sozusagen, alle Kugel stoßen sich ab und die, die sich folgen, ziehen sich an und 154 00:11:54,890 --> 00:11:58,570 daraus kann man halt solche komplexen Netzwerke grafisch darstellen. Das 155 00:11:58,570 --> 00:12:03,060 Interessante ist, dass die Fake-News- Verbreiter sich in einer Gruppe fast 156 00:12:03,060 --> 00:12:10,440 außerhalb befinden und eigentlich nur noch über die Massenmedien verbunden sind mit 157 00:12:10,440 --> 00:12:14,860 der Gesellschaft. Man sieht natürlich auch noch Tendenzen, dass viele Fake-News- 158 00:12:14,860 --> 00:12:18,280 Verbreiter dann mit Lügenpresse usw. versuchen sich weiter von diesen-- 159 00:12:18,280 --> 00:12:23,080 von den Medien zu distanzieren. Aber tatsächlich sind es zwei verschiedene 160 00:12:23,080 --> 00:12:28,840 Gruppen, die man hier sehen kann und das erste Mal, als ich das Bild gesehen habe, 161 00:12:28,840 --> 00:12:32,310 habe ich gedacht: "Oh, das ist eine Filterblase oder eine Echokammer oder 162 00:12:32,310 --> 00:12:37,930 sowas." Das Schöne ist, weil wir mit Twitter-APIs tiefer in die Daten rein- 163 00:12:37,930 --> 00:12:44,310 gucken können, können wir von jedem ein-- die die Timeline rekonstruieren. Also ich 164 00:12:44,310 --> 00:12:49,800 hab jetzt mal so schematisch dargestellt die Gegendarsteller und die Fake-News- 165 00:12:49,800 --> 00:12:55,830 Verbreiter und man sieht, dass von den Fake-News-Verbreitern 89% die 166 00:12:55,830 --> 00:13:00,980 Gegendarstellungen mitbekommen haben, aber sie nicht weiter teilen. Und nur 45% 167 00:13:00,980 --> 00:13:04,020 derjenigen, die die Gegendarstellung verbreitet haben, haben 168 00:13:04,020 --> 00:13:07,710 die tatsächliche ursprüngliche Fake News eigentlich mitbekommen. Das Ergebnis 169 00:13:07,710 --> 00:13:14,211 daraus ist, es gibt eine Filterblase und zwar bekommen wir die Fake News nicht mit. 170 00:13:14,211 --> 00:13:18,400 *Gelächter* Was ist jetzt eigentlich tatsächlich 171 00:13:18,400 --> 00:13:23,220 dieser Impact dieser Gruppe. Und dann hab' ich ganz ganz schweres Geschütz 172 00:13:23,220 --> 00:13:27,780 aufgefahren und habe 1,6 Millionen Twitter-Accounts, die angegeben haben, 173 00:13:27,780 --> 00:13:31,780 dass sie Deutsch sprechen, extrahiert und geguckt, wie die sich gegenseitig folgen. 174 00:13:31,780 --> 00:13:35,670 Also ähnlich wie diese Filterblasengrafik gerade sieht man hier jetzt das gesamte 175 00:13:35,670 --> 00:13:39,432 deutschsprachige Twitternetzwerk, eingefärbt nach Herkunftsland. Also hier 176 00:13:39,432 --> 00:13:43,090 unten haben wir die Schweiz und da haben wir Österreich, wenn man ein bisschen 177 00:13:43,090 --> 00:13:45,589 klickt, sieht man das so wer sich dahinter befindet. 178 00:13:45,589 --> 00:13:46,836 Und das Schöne ist, ... 179 00:13:46,836 --> 00:13:50,090 das ist son Tool was ich gebastelt habe Man kann das unterschiedlich einfärben. 180 00:13:50,090 --> 00:13:54,160 Hier kann man zum Beispiel mal das Alter des Accounts einfärben. Rot 181 00:13:54,160 --> 00:13:57,810 sind die alten, grün sind die eher neueren Accounts. Hier oben sind die 182 00:13:57,810 --> 00:14:02,770 Jugendlichen, da ist viel Justin Bieber und YouTube und Let's Play dabei. Hier 183 00:14:02,770 --> 00:14:09,120 haben wir eine Blase, die sich mit Porn beschäftigt (*Lachen*), nicht drauf klicken. 184 00:14:09,120 --> 00:14:13,470 Hier haben wir eine Gruppe, die sich mit Marketing beschäftigt, so würde ich das 185 00:14:13,470 --> 00:14:19,350 mal umschreiben, größtenteils SEO und keine Ahnung was. Und das sind die Leute, 186 00:14:19,350 --> 00:14:23,320 die sich eigentlich mit Politik und Medien beschäftigen und vielleicht auch die, die 187 00:14:23,320 --> 00:14:26,750 jetzt hier auch hier im Raum auf Twitter sind, wahrscheinlich am meisten 188 00:14:26,750 --> 00:14:32,220 mitbekommen. Man kann aber diese Grafik auch anders einfärben und zwar kann ich 189 00:14:32,220 --> 00:14:38,880 mal einfärben, welche Bundestagsabgeordneten oder Kandidaten von 190 00:14:38,880 --> 00:14:42,571 Parteien wo sich in diesem Netzwerk befinden und entsprechend einfärben. Und 191 00:14:42,571 --> 00:14:48,460 man sieht zum Beispiel Gelb FDP, Schwarz, Rot, Grün, Blau, Rot, Grün befinden sich 192 00:14:48,460 --> 00:14:53,541 alle so in einer verteilten Gruppe und es gibt eine sehr enge Gruppe aus Leuten, die 193 00:14:53,541 --> 00:14:59,390 Mitglieder der AfD sind und auf Twitter aktiv sind. Ich vergrößer das mal so ein 194 00:14:59,390 --> 00:15:03,030 bisschen. Und jetzt verändere ich wieder diese Färbung und zwar als erstes 195 00:15:03,030 --> 00:15:06,815 die Fake-News-Verbreiter. Ja. *Gelächter* 196 00:15:06,815 --> 00:15:15,029 Der Witz ist. *Applaus* 197 00:15:15,029 --> 00:15:18,630 Der Witz ist, dass es nicht die AfD- Abgeordneten selber sind, die das Fake- 198 00:15:18,630 --> 00:15:22,540 News verbreiten, aber sie befinden sich in einer gleichen Gruppe da drin. Man kann 199 00:15:22,540 --> 00:15:26,590 auch einfärben nach Alter. Man sieht, dass die Accounts dieser Gruppe eher jung sind, 200 00:15:26,590 --> 00:15:31,820 also relativ frisch auf Twitter. Sie haben eine sehr hohe Aktivität. Rot heißt viele 201 00:15:31,820 --> 00:15:35,410 Tweets pro Tag veröffentlicht werden. Und man kann von dieser Gruppe auch 202 00:15:35,410 --> 00:15:40,190 schauen, welche typischen Begriffe sie verwenden, um zu vergleichen, mit was das 203 00:15:40,190 --> 00:15:44,161 restliche Twitter-Netzwerk für Begriffe verwendet. Und die Begriffe, die am 204 00:15:44,161 --> 00:15:47,920 häufigsten in dieser Gruppe verwendet werden, im Vergleich zu anderen 205 00:15:47,920 --> 00:15:52,430 Twitter-Accounts, sind Islam, Deutschland, Migranten, Merkel, Maas, Politik, 206 00:15:52,430 --> 00:15:56,990 Freiheitskampf, Flüchtlinge, SPD, Netzdurchsetzungsgesetz, NPD, Antifa, 207 00:15:56,990 --> 00:16:02,910 Zensur, PEGIDA, Syrer, Asylbewerber. Man sieht relativ klar, dass diese Gruppe auch 208 00:16:02,910 --> 00:16:07,890 eher monothematisch unterwegs ist. Also, was ist das für eine Gruppe? Und ich sehe 209 00:16:07,890 --> 00:16:13,480 wir müssen uns beeilen. Sie sind relativ neu auf Twitter. Sie stehen der AfD nah. 210 00:16:13,480 --> 00:16:19,740 Sie teilen oft Fake News. Sie sind auf Twitter sehr aktiv. Und sie befassen sich 211 00:16:19,740 --> 00:16:25,870 fast monothematisch mit Migrations- und Asylpolitik. Und ich komme auf diese 212 00:16:25,870 --> 00:16:30,470 Gruppe wieder zurück, denn den ersten- die erste Theorie, die man jetzt reinwerfen 213 00:16:30,470 --> 00:16:37,399 würde, sind Social Bots. Und da es in diesem Vortrag auch darum geht, ist der 214 00:16:37,399 --> 00:16:42,120 nächste Block sich mal das Thema Social Bots genauer anzuschauen. Zu Social Bots 215 00:16:42,120 --> 00:16:46,930 wurde eine Menge veröffentlicht, auch in den Medien. „Warum Meinungsroboter die 216 00:16:46,930 --> 00:16:50,930 Gefahr für die Demokratie werden.“, „Digitale Dreckschleudern“, „Angriff der 217 00:16:50,930 --> 00:16:57,940 Meinungsroboter“. Jeder hat da irgendwie auch seine Meinung und seine Gefahr 218 00:16:57,940 --> 00:17:02,460 hervorgebracht. Was sind eigentlich Social Bots? Es gibt aus dem Büro für 219 00:17:02,460 --> 00:17:06,920 Technikfolgen-Abschätzung beim Deutschen Bundestag einen Absatz, den ich mal 220 00:17:06,920 --> 00:17:10,609 herausgegriffen habe. Social Bots, die Computerprogramme, die uns irgendwie in 221 00:17:10,609 --> 00:17:14,769 den sozialen Medien manipulieren können. „Echte Menschen, die mit dem Social Bot 222 00:17:14,769 --> 00:17:18,556 kommunizieren, nehmen diese nicht als durch Algorithmen ausgelöste automatische 223 00:17:18,556 --> 00:17:22,120 Kommunikation, sondern als echte Internet- teilnehmer wahr und sind sich der 224 00:17:22,120 --> 00:17:26,270 Manipulation nicht bewusst." Konkret, was diese Social Bots angeblich machen sollen 225 00:17:26,270 --> 00:17:31,040 können, sind, sie können den Turing-Test bestehen. Das heißt, Die Idee eines Turing 226 00:17:31,040 --> 00:17:35,080 Tests ist, ich interagiere mit etwas und kann hinterher sagen, 227 00:17:35,080 --> 00:17:37,000 ob es ein Mensch, oder ein Computer ist. 228 00:17:37,000 --> 00:17:40,420 Und diese Social Bots sollen jetzt magischer Weise diesen Turing-Test 229 00:17:40,420 --> 00:17:44,690 bestehen können und können nicht nur so tun als wären sie ein Mensch, sondern sie 230 00:17:44,690 --> 00:17:49,220 können angeblich sogar noch unsere Meinung beeinflussen. Naja, zumindest hat der 231 00:17:49,220 --> 00:17:50,490 Bundestag veröffentlicht: 232 00:17:50,490 --> 00:17:53,448 "Wirkung von Social Bots ist unter Sachverständigen strittig." 233 00:17:53,448 --> 00:17:57,800 Ich hab mal extra das vorgespult, wo Linus Neumann zu sehen ist. Aber, da ich 234 00:17:57,800 --> 00:18:01,900 ja so ein Framework habe, kann ich jetzt auch selber mal reinschauen. Was sind denn 235 00:18:01,900 --> 00:18:05,820 diese Social Bots? Da kommt man schnell in so einen Teufelskreis. Wenn ich Social 236 00:18:05,820 --> 00:18:10,800 Bots auf Twitter finden möchte, dann muss ich sie erstmal suchen. Und dazu muss ich 237 00:18:10,800 --> 00:18:14,660 erst mal wissen, wie sie denn eigentlich aussehen. Und um zu wissen, wie sie 238 00:18:14,660 --> 00:18:18,050 aussehen, muss ich sie erst mal analysieren können und dazu brauche ich 239 00:18:18,050 --> 00:18:21,940 erst mal welche. Also, zu sagen „Okay, da gibts irgendwelche.", das bringt nichts. 240 00:18:21,940 --> 00:18:27,000 Ich muss entweder eine Gruppe haben, um sie analysieren zu können, damit ich die 241 00:18:27,000 --> 00:18:30,610 Eigenschaften rauskriegen kann, oder andersrum. Und diesen Teufelskreis 242 00:18:30,610 --> 00:18:34,210 durchbrechen, gibt unterschiedliche Möglichkeiten. Ich habe mich mal für den 243 00:18:34,210 --> 00:18:38,670 folgenden Weg entschlossen. Ich kaufe jetzt einfach mal Social Bots. 244 00:18:38,670 --> 00:18:39,795 *Gelächter* 245 00:18:40,030 --> 00:18:42,740 Kleine Anmerkung, Moment, Moment. 246 00:18:42,750 --> 00:18:45,429 Es sind nicht wirklich Social Bots im dem engeren Sinne, 247 00:18:45,429 --> 00:18:49,920 sondern ich hab mir einfach 4.500 Bots gekauft. Ob die jetzt tatsächlich dann 248 00:18:49,920 --> 00:18:53,620 auch mit den Leuten sozial interagieren usw., weiß ich ja nicht. Aber im 249 00:18:53,620 --> 00:18:57,610 Kern hab ich mir einen Twitter-Account Software Team Berlin geholt. Habe keinem 250 00:18:57,610 --> 00:19:01,309 gesagt, damit ich also weiß, dass kein realer Mensch diesem Account folgt und 251 00:19:01,309 --> 00:19:06,530 habe dann auf Google gesucht „buy Twitter Bots". Genau. Und dann gibt's dann 4.500 252 00:19:06,530 --> 00:19:09,870 Follower und davon sind 100% Bots. Das ist nur um zu gucken, welche 253 00:19:09,870 --> 00:19:13,870 Technologien werden dann eingesetzt, obs dann Follower Bots sind usw. Um zu 254 00:19:13,870 --> 00:19:17,820 gucken, sehe ich dann bestimmte Eigenschaften, die ich bei Menschen nicht 255 00:19:17,820 --> 00:19:24,309 sehe. Also sozusagen eher eine Trockenübung, ja. Also wieder das große 256 00:19:24,309 --> 00:19:28,220 Twitter-Framework draufgeworfen und die Metadaten analysiert. Und raus kommt 257 00:19:28,220 --> 00:19:35,050 folgende Grafik: Jeder einzelne Punkt ist eines dieser eingekauften Follower. 4.500 258 00:19:35,050 --> 00:19:39,190 Punkte, und ich weiß 100 % Bots dabei. Und ich versuche die nun zu 259 00:19:39,190 --> 00:19:43,181 sortieren nach ihren Eigenschaften. Alles, was eher wie ein Bot aussieht, ist auf der 260 00:19:43,181 --> 00:19:47,007 linken Seite und alles ,was eher wie ein Mensch aussieht, auf der rechten Seite. 261 00:19:47,007 --> 00:19:50,280 Ich kann jetzt auf die einzelnen drauf klicken; ich klicke jetzt mal auf den ganz 262 00:19:50,280 --> 00:19:56,370 linken unteren drauf, dann hab ich einen Asus D5B23, und habe unterschiedliche 263 00:19:56,370 --> 00:20:00,340 Eigenschaften von dem, die ich von ihm überprüft habe, wie zum Beispiel, ob er 264 00:20:00,340 --> 00:20:06,510 immer noch sozusagen ein Egg ist, also ob er noch gar kein Avatar Bild hochgeladen 265 00:20:06,510 --> 00:20:12,799 hat, ob er weniger als 10 Follower hat, wieviele Favs er hat, abgesetzt hat. Ob er 266 00:20:12,799 --> 00:20:18,640 noch gar keine Beschreibungstext für sich angegeben hat und ob er keine Zeitzone 267 00:20:18,640 --> 00:20:21,890 angegeben hat. Also so die ganzen Metadaten, die man halt aus Twitter 268 00:20:21,890 --> 00:20:24,010 herausbekommt zum analysieren, um zu gucken, 269 00:20:24,010 --> 00:20:26,640 ob die sich denn irgendwie strukturieren und gruppieren. 270 00:20:26,640 --> 00:20:29,469 Man sieht auch ganz links, das sind so ein Bisschen die sehr 271 00:20:29,469 --> 00:20:33,380 dummen Bots. Die sind jung und teilweise tun sie auch gar nichts, sondern folgen 272 00:20:33,380 --> 00:20:36,810 nur Leuten. Dann gibt es einen großen und breiten Bereich, teilweise sehr 273 00:20:36,810 --> 00:20:41,620 realistische Bots dabei, teilweise sind es sogar reale Accounts die verwaist sind, 274 00:20:41,620 --> 00:20:45,960 also die seit drei Jahren inaktiv sind und auf irgendeiner Art, also aus irgendeinem 275 00:20:45,960 --> 00:20:49,650 Grund übernommen wurden. Wahrscheinlich hat sich da einer mal mit Passwort 276 00:20:49,650 --> 00:20:54,950 durchprobieren massenhaft versucht verwaiste Accounts zu übernehmen. Und 277 00:20:54,950 --> 00:20:58,570 die dritte, und das fand ich sehr interessant, das sind Accounts die 278 00:20:58,570 --> 00:21:03,000 teilweise sogar verifizierte Menschen sind. Also ich habe jetzt mal schonmal 279 00:21:03,000 --> 00:21:10,250 Peggy, die ist Moderatorin aus den Staaten irgendwo, Jeff Zausch ist ein Survival 280 00:21:10,250 --> 00:21:15,430 Spezialist und Chris Glorioso. Das sind, das sind reale Personen, die mir gefolgt 281 00:21:15,430 --> 00:21:19,570 sind weil ich dafür bezahlt habe, als Bot, und das fand ich sehr merkwürdig. Ich habe 282 00:21:19,570 --> 00:21:22,650 versucht mit den Leuten Kontakt aufzunehmen; nicht alle haben mir 283 00:21:22,650 --> 00:21:26,300 geantwortet. Der Grund dafür ist, dass ihr Account gehijacked wurde und sie haben 284 00:21:26,300 --> 00:21:29,280 dann eigentlich nur noch DMs von irgendwelchen fremden Accounts bekommen. 285 00:21:29,280 --> 00:21:32,670 Die haben auf DMS auch gar nicht mehr so richtig reagiert. Ich habe auch versucht 286 00:21:32,670 --> 00:21:37,320 herauszubekommen, auf welchem Wege das passiert ist – ob sie sich dort irgendwie 287 00:21:37,320 --> 00:21:42,440 einen Twitter Service eingetreten haben der in ihrem Namen postet. Ich weiß es 288 00:21:42,440 --> 00:21:46,640 nicht. Laut eigenen Aussagen ging es dann aber weniger um politische Inhalte, 289 00:21:46,640 --> 00:21:50,290 sondern Zitat, es war eher "Sex Scheisse" die dann in ihren Twitter Timelines 290 00:21:50,290 --> 00:21:53,890 veröffentlicht wurde. Was ich aber spannend finde, ist wenn man so eine CDU 291 00:21:53,890 --> 00:21:57,770 Forderung, Kennzeichnung von Social Bots. Ja was ist denn, wenn der eigene Account 292 00:21:57,770 --> 00:22:01,940 übernommen wurde. Also der wird dann, der eigene Account ist mit einmal halb 293 00:22:01,940 --> 00:22:06,110 automatisiert, ob man es will oder nicht. Eine Fragestellung die ich dann auch 294 00:22:06,110 --> 00:22:10,820 nochmal jetzt kurz im Vortrag hatte weil die Daten ja jetzt 11 Monate alt sind: 295 00:22:10,820 --> 00:22:15,640 Welche Accounts gibts denn heute noch? Und man sieht grün, die Accounts gibt's heute 296 00:22:15,640 --> 00:22:20,090 noch, elf, gelb sind die Accounts die in der Zwischenzeit von Twitter gesperrt 297 00:22:20,090 --> 00:22:25,350 wurden, und rot die Accounts die von sich aus sich gelöscht haben. Genau. Also man 298 00:22:25,350 --> 00:22:29,930 sieht zumindest dass da Bewegung von Seiten Twitter passiert. Was man jetzt an 299 00:22:29,930 --> 00:22:33,690 diesen Bots auch noch analysieren kann, ist die Follower Netzwerke, wie die sich 300 00:22:33,700 --> 00:22:39,951 also gegenseitig folgen. Da habe ich mal folgende Grafik gemacht. Das sind so die 301 00:22:39,951 --> 00:22:45,390 4.5 Tausend Bots und wem sie folgen und von wem sie gefolgt werden. Rot 302 00:22:45,390 --> 00:22:52,820 *Trinken* rot sind die Bots, 4.5 Tausend, und blau sind die anderen Nutzer, andere 303 00:22:52,820 --> 00:22:56,700 Accounts oder so weiter. Da kann man auch mal ein Bisschen rein zoomen hier, sieht 304 00:22:56,700 --> 00:23:05,710 auch ganz hübsch aus. Fast wie fliegende Spaghetti Monster, fand ich. Die Blauen, 305 00:23:05,710 --> 00:23:10,970 das scheinen mir Jugendliche zu sein, die sich einfach Twitter-Bots oder Follower 306 00:23:10,970 --> 00:23:14,260 gekauft haben, was eigentlich ganz interessant ist dass ich dann damit 307 00:23:14,260 --> 00:23:17,860 eigentlich die Kunden die analysieren kann. Wobei man vorsichtig sein muss, 308 00:23:17,860 --> 00:23:22,730 jemandem 10,000 Bots oder Follower künstlich anzuhängen ist halt relativ 309 00:23:22,730 --> 00:23:27,730 einfach zu machen und ist auch gar nicht so teuer. 50,000 Bots gibt es so für 60 310 00:23:27,730 --> 00:23:35,230 Dollar. Wie könnte man Bots noch erkennen? Und da gibt es halt so eine 311 00:23:35,230 --> 00:23:39,670 Tweet-App Analyse. Ich weiß nicht ob ihr euch noch erinnern könnt, vor einigen 312 00:23:39,670 --> 00:23:44,260 Jahren stand unter jedem Tweet noch drunter, mit welcher App man diesen Tweet 313 00:23:44,260 --> 00:23:49,040 veröffentlicht hat. Das steht leider jetzt nicht mehr drunter, aber die Daten sind 314 00:23:49,040 --> 00:23:54,431 noch in der API drin. So sieht übrigens so eine API Antwort von Twitter aus, und da 315 00:23:54,431 --> 00:23:59,050 steht unter anderem auch Source drin, d.h. also mit welchem Service man das 316 00:23:59,050 --> 00:24:02,850 veröffentlicht hat. Habe ich mal über die Bots rüber laufen lassen. Twitter für 317 00:24:02,850 --> 00:24:07,930 iPhone, Android, Web Client, aber auch Facebook, die automatisch dann sozusagen 318 00:24:07,930 --> 00:24:12,000 das heisst den Post als Tweet veröffentlichen und Instagram. Und 319 00:24:12,000 --> 00:24:17,620 interessant fand ich halt 350 weitere Services, ja. So sehen die aus. Genau. 320 00:24:17,620 --> 00:24:24,730 Also es ist ein riesen Potpourri, Koreanisch Japanisch alles dabei. Genau. 321 00:24:24,730 --> 00:24:29,410 Das war mir ja auch gar nicht so richtig klar vorher, dass es eigentlich ein 322 00:24:29,410 --> 00:24:33,850 riesiges enormes Ökosystem gibt von Skripten die auf Twitter Sachen 323 00:24:33,850 --> 00:24:42,461 veröffentlichen. Und wie gesagt, halt in meiner Probe sind es allein 350. Um den 324 00:24:42,461 --> 00:24:47,049 Leuten auch zu zeigen, was das denn jetzt eigentlich für Services sind, die dahinter 325 00:24:47,049 --> 00:24:50,530 stecken, habe ich mal so ein paar herausgegriffen. Hier ist zum Beispiel 326 00:24:50,530 --> 00:24:54,870 FeedBlitz. Das ist eigentlich ein Bot der nichts weiter macht als einen RSS Feed in 327 00:24:54,870 --> 00:25:00,110 Twitter zu posten. Haben wir twittbot.net, das ist irgendwie was selber gebasteltes. 328 00:25:00,110 --> 00:25:04,170 Der twittert aber irgendwie nur Käse, das hat sich wahrscheinlich einer mal ein 329 00:25:04,170 --> 00:25:07,900 Bisschen herumexperimentiert oder sowas. Es gibt aber auch den Kim Kardashian: 330 00:25:07,900 --> 00:25:12,000 Hollywood Service, der dir dann wahrscheinlich die neuen Spielestände 331 00:25:12,000 --> 00:25:17,860 veröffentlich. Interessant fand ich auch, es gab 9 gelöschte Services, die 332 00:25:17,860 --> 00:25:21,390 dann umbenannt wurden in "Erased" und eine lange Nummer. Ich würde mich mal 333 00:25:21,390 --> 00:25:25,090 interessieren ob die Nummer fortlaufend ist, denn sie endet mit 5.6 Millionen. 334 00:25:25,090 --> 00:25:29,530 Sind das jetzt 5.6 Millionen gelöschte Services, oder sind insgesamt bei Twitter 335 00:25:29,530 --> 00:25:33,410 schon 5.6 Millionen angemeldet worden. Ich weiß es nicht. Aber wir können darüber 336 00:25:33,410 --> 00:25:37,470 sprechen oder wir können sagen, dass auf Twitter nicht mehr nur Menschen unterwegs 337 00:25:37,470 --> 00:25:42,860 sind sondern halt auch Services die wir nutzen. Genau. Bots sind auch nicht nur 338 00:25:42,860 --> 00:25:46,110 böse. Ich habe mal ein paar herausgegriffen. Ich weiß nicht ob jemand 339 00:25:46,110 --> 00:25:51,840 die Rathausuhr Neukölln kennt. *Applaus* & *Lachen* Ist der Entwickler da? Nein. Der 340 00:25:51,840 --> 00:25:56,280 Entwickler der das Rathaus Uhrwerk Neukölln als Service benutzt, also der 341 00:25:56,280 --> 00:26:05,090 veröffentlicht sowas wie acht bämm bämm bämm bämm bämm bämm bämm bämm. 342 00:26:05,090 --> 00:26:08,900 Vor kurzem bin ich übrigens auf den Wichser Bot gestoßen. Wenn man einen Tweet 343 00:26:08,900 --> 00:26:12,880 veröffentlicht wo das Wort Wichser drin vorkommt, dann retweetet der einen. 344 00:26:12,880 --> 00:26:20,170 Spiegelonline Top benutzt den Service if this than that, zu 100%, also nicht 345 00:26:20,170 --> 00:26:26,090 normal SpiegelOnline sondern Top. Und ZEIT ONLINE Digital hat sich auch einen Service 346 00:26:26,090 --> 00:26:30,020 gebaut, ich weiß nicht ob der eingekauft oder selbst entwickelt ist, aber der ist 347 00:26:30,020 --> 00:26:35,711 registriert als ZEIT ONLINE. Ich fasse zusammen: Woran könnte man Bots erkennen? 348 00:26:35,711 --> 00:26:40,669 Ist das Profil vollständig? Ist ein Avatar Bild und Beschreibungstext dran? Ist der 349 00:26:40,669 --> 00:26:47,460 Account Teil eines Netzwerkes? Von welcher App werden die Tweets abgeschickt und wie 350 00:26:47,460 --> 00:26:51,620 sehen die anderen Metadaten des Accounts oder der Tweets aus? Interessant ist, 351 00:26:51,620 --> 00:26:56,240 dass das aber alles Indizien Beweise sind. Wenn man anfängt, sich tatsächlich mal 352 00:26:56,240 --> 00:27:00,220 hinzusetzen und zu gucken, ist das nun ein Bot oder nicht, kommt man relativ schnell 353 00:27:00,220 --> 00:27:05,070 ins Grübeln. Jegliche Bot Erscheinung könnte auch gut menschlich erklärt sein 354 00:27:05,070 --> 00:27:07,249 und andersherum. Man kann aber auch 355 00:27:07,249 --> 00:27:09,599 rangehen, dass man jedes menschliche Verhalten in 356 00:27:09,599 --> 00:27:14,830 die Sphäre, das könnte und natürlich auch ein hochintelligente KI sein schien. 357 00:27:14,830 --> 00:27:18,471 Egal, auf jeden Fall mit diesem Kenntnisstand sag ich mal lasst uns jetzt 358 00:27:18,471 --> 00:27:22,440 mal Bots finden. Ich habe gesucht. Ich hab lange lange lange gesucht und ich kürz es 359 00:27:22,440 --> 00:27:28,480 mal ab mit: ich habe gefunden inaktive Accounts, Service Accounts, Trolle welche 360 00:27:28,480 --> 00:27:32,940 Teenager, Rassisten und Hater und Spam mit links zu YouTube Polen und Bitcoin schickt 361 00:27:32,940 --> 00:27:37,330 und so weiter. Aber was ich nicht gefunden habe ist diese politisch aktiven Social 362 00:27:37,330 --> 00:27:41,230 Bot Netzwerke, und dafür gibt es zwei Erklärungen: Entweder die gibts nicht oder 363 00:27:41,230 --> 00:27:49,640 Ich bin zu doof. Also fragen wir mal die Profis wie machen die das denn. Und einer 364 00:27:49,640 --> 00:27:55,160 davon ist zum Beispiel Professor Dr. Simon Hegelich, Forschungsfeld Political Data 365 00:27:55,160 --> 00:28:02,360 Science, Forschungsmethoden Machine Learning plus X. Ist das VELTINS, die mit 366 00:28:02,360 --> 00:28:07,429 plus X ist Alkohol, ne, ich weiß nicht, keine Ahnung. Der veröffentlicht Studien 367 00:28:07,429 --> 00:28:10,950 zum Beispiel für die Konrad-Adenauer- Stiftung mit dem Titel "Invasion der 368 00:28:10,950 --> 00:28:16,429 Meinungs-Roboter". Leider wird in dieser Studie die Methodik nicht beschrieben. 369 00:28:16,429 --> 00:28:21,299 Hegelich hatte selber damals mit Professor Dietmar Jaresko eine Studie veröffentlicht 370 00:28:21,299 --> 00:28:26,190 wo sie tatsächlich ein Bot-Netzwerk gefunden haben in der Ukraine. Was sie 371 00:28:26,190 --> 00:28:30,261 dabei identifizieren konnten ist dass diese Accounts unter einem Service 372 00:28:30,261 --> 00:28:36,210 "twifarm" prorussische Meldungen veröffentlicht haben, insgesamt 1740 Bots 373 00:28:36,210 --> 00:28:42,180 haben sie darunter gefunden. Und genau das ist auf jeden Fall, das kann man glaube 374 00:28:42,180 --> 00:28:46,690 ich sagen, ein Bot-Netzwerk, was dort in der Ukraine gefunden wurde. Aber wie sieht 375 00:28:46,690 --> 00:28:50,650 das eigentlich mit der deutschen Debatte aus? Und dazu hab ich, vielleicht habs ich 376 00:28:50,650 --> 00:28:54,200 auch nicht gefunden aber ich habe zumindest keine Studie von Prof. Hegelich 377 00:28:54,200 --> 00:28:58,030 dazu gefunden, mit einer nachprüfbaren Methodik. Was ich aber gefunden habe ist 378 00:28:58,030 --> 00:29:04,230 ein ZDF Bericht, ZDF Zoom "Alles nur Lüge? Wie im Netz getäuscht wird". Professor 379 00:29:04,230 --> 00:29:09,630 Simon Hegelich hatte hier die Aufgabe, aus Gigabytes an Daten Social Bots zu suchen. 380 00:29:09,630 --> 00:29:15,380 Und er hatte einen möglichen Kandidaten gefunden, und zwar Egon Dombrowski, der 381 00:29:15,380 --> 00:29:22,570 136 Posts am Tag veröffentlich mit ganz klarer Tendenz zu Pegida und AfD. Nun ist 382 00:29:22,570 --> 00:29:26,710 natürlich spannend: Ist das vielleicht ein gesteuerter Bot? Oder handelt es sich 383 00:29:26,710 --> 00:29:30,160 dabei um einen realen Menschen? Die Redaktion hat ihn einfach mal 384 00:29:30,160 --> 00:29:37,270 angeschrieben, und der potenzielle Social Bot heißt Egon Dombrowski. Ist 50 Jahre 385 00:29:37,270 --> 00:29:42,800 alt, berufsunfähig Rentner, lebt in Erfurt und war in einem Gemeinderat für die SPD. 386 00:29:42,800 --> 00:29:50,220 Und jetzt ist er auf Facebook sehr aktiv. Medien bezeichnet er als Propaganda- 387 00:29:50,220 --> 00:29:55,350 Presse, und er macht Werbung für die AfD und wird laut eigener Aussage nicht von 388 00:29:55,350 --> 00:30:00,400 der AfD oder anderen bezahlt, er macht das aus eigener überzeugung. Gut, also der 389 00:30:00,400 --> 00:30:04,370 Versuch, hier einen Social Bot zu finden, ist missglückt, wir haben leider nur eine 390 00:30:04,370 --> 00:30:08,600 reale Person gefunden. Aber es gibt auch andere die sich damit beschäftigen, 391 00:30:08,600 --> 00:30:14,130 beispielsweise botswatch.de, die versuchen, parallel zu wichtigen Events in 392 00:30:14,130 --> 00:30:19,890 Deutschland zu gucken, wie viel sich auf Twitter nun Social Bots einmischen, 393 00:30:19,890 --> 00:30:24,490 veröffentlichen auch das Bot-Barometer und so weiter. Und da gibts auch einen Link 394 00:30:24,490 --> 00:30:27,910 zur Methode wie sie das machen, und da steht dann drin "Accounts die 395 00:30:27,910 --> 00:30:31,710 durchschnittlich gleich oder mehr als 50 Tweets am Tag veröffentlichen". Hab ich 396 00:30:31,710 --> 00:30:38,080 ihnen gesagt "Naja, Dombrowski schafft 136 Posts am Tag." Ich hatte, weil 397 00:30:38,080 --> 00:30:42,830 wir die Bundestagswahl beobachtet haben eine lange Liste von Accounts 398 00:30:42,830 --> 00:30:46,070 zusammengestellt, die irgendwie beim Thema Bundestagswahl mitmischten 399 00:30:46,070 --> 00:30:48,010 und bin die einfach mal durchgegangen, 400 00:30:48,010 --> 00:30:51,229 an welchen Tagen haben die mehr als 50 Tweets abgesetzt und hier ist 401 00:30:51,229 --> 00:30:55,850 mal so ein bisschen Zusammenfassung: sogar eine CDU/CSU und FDP haben das geschafft. 402 00:30:55,850 --> 00:31:03,270 Genau. Also, 50 Tweets am Tag und schon ist man Social Bot, mit drunter sind 403 00:31:03,270 --> 00:31:10,490 Medien wie Welt, die schaffen 190 am Tag, Focus Online 97 am Tag. Auch Christopher 404 00:31:10,490 --> 00:31:15,559 Lauer 72. Anja Schillhaneck von den Bündnes 90 / Die Grünen im Berliner 405 00:31:15,559 --> 00:31:19,250 Abgeordnetenhaus schafft fast die Grenze mit 50 am Tag. Und natürlich auch die 406 00:31:19,250 --> 00:31:23,090 Parteien vor den Bundestagswahlen, die dann natürlich in den sozialen Netzwerken 407 00:31:23,090 --> 00:31:27,860 besonders aktiv sind, schaffen mehr als 50, und dann noch Hipster, Aktivisten, 408 00:31:27,860 --> 00:31:32,429 AfD-Anhänger darunter geschrieben. Also 50 Tweets am Tag als Kriterium für Social 409 00:31:32,429 --> 00:31:37,190 Bots ist wissenschaftlich unseriös. Da frage ich mich natürlich: Wie kommen die 410 00:31:37,190 --> 00:31:41,390 da drauf? Und davor steht es auch: Das sei das Social Bot-Kriterium der Oxford- 411 00:31:41,390 --> 00:31:47,030 Universität. Das finde ich natürlich spannend, und habe dann angefangen, die 412 00:31:47,030 --> 00:31:53,650 ganzen Studien und wissenschaftlichen Paper dazu durchgelesen wie deren Methode 413 00:31:53,650 --> 00:31:59,720 ist. Und ich hab nur zwei herausgegriffen, weil es wirklich eine Menge ist, die 414 00:31:59,720 --> 00:32:09,049 besonders das deutlich machen. Social Bots bei den US-Wahlen. Das ist ein Paper was 415 00:32:09,049 --> 00:32:13,400 veröffentlicht wurde mit dem Titel "Bots and Automation over Twitter during the 416 00:32:13,400 --> 00:32:18,809 U.S. Election" und ich spule mal vor was an welcher Stelle Sie das definieren. Da 417 00:32:18,809 --> 00:32:24,910 muss ich mal kurz sagen: Sie fangen halt an, von Social Bots zu reden. Dann heißt 418 00:32:24,910 --> 00:32:28,750 es irgendwann "Social Bot like" und dann steht dann so etwas wie "Heavy Automated 419 00:32:28,750 --> 00:32:33,539 Bots". Und dann steht dann zum Schluss "we define a high level of automation as 420 00:32:33,539 --> 00:32:37,659 accounts that post at least 50 times a day using one of these election-related 421 00:32:37,659 --> 00:32:43,780 hashtags". Das heißt also, wer mehr als 50 Mal am Tag ein bestimmtes Hashtag 422 00:32:43,780 --> 00:32:47,580 veröffentlicht, wird als social Bot kategorisiert. Die Hashtags sind die hier. 423 00:32:47,580 --> 00:32:52,669 Der erste Block sind die pro-Trump- Hashtags, zweite Block die pro-Clinton- 424 00:32:52,669 --> 00:32:56,390 Hashtags, und der dritte Block sind Hashtags, die sich generell um die 425 00:32:56,390 --> 00:33:01,710 amerikanische Wahl beschäftigen. Aber zu dieser Definition von Social Bots habe ich 426 00:33:01,710 --> 00:33:06,870 mal ein paar Fragen: Also erstens, warum sind das 50 und nicht 30 oder 100 Tweets 427 00:33:06,870 --> 00:33:13,140 am Tag? Und gilt das dann für alle Länder, also kann man jetzt dieses Kriterium aus 428 00:33:13,140 --> 00:33:16,840 Amerika eins zu eins übernehmen für Deutschland? Und was für Accounts sind das 429 00:33:16,840 --> 00:33:20,700 eigentlich? Ich meine wenn ich die wenn ich die identifizieren kann, dann kann ich 430 00:33:20,700 --> 00:33:24,440 die ja auch mal genauer anschauen, wie viele Follower haben die? Wie viele Favs 431 00:33:24,440 --> 00:33:27,910 und retweets haben sie? Vielleicht veröffentlichen sie ja wahnsinnig viele 432 00:33:27,910 --> 00:33:31,630 Tweets aber keiner liest es. Und über welches Service posten sie? Das hatte ich 433 00:33:31,630 --> 00:33:36,330 vorhin gezeigt, dass man das nachschauen kann. Und klar kann ich verstehen, dass es 434 00:33:36,330 --> 00:33:38,690 halt eine Menge Accounts sind, aber es gibt eine 435 00:33:38,690 --> 00:33:40,861 wissenschaftlich statistisch saubere Methode: 436 00:33:40,861 --> 00:33:42,970 Man nimmt einfach eine Stichprobe, man wählt einfach mal zufällig 437 00:33:42,970 --> 00:33:46,120 100 aus und guckt sich halt an, was das für Accounts sind, um zu gucken, ob sie 438 00:33:46,120 --> 00:33:50,600 tatsächlichen politischen Einfluss haben. Dazu gibts aber in dieser Studie keine und 439 00:33:50,600 --> 00:33:55,100 auch den anderen keine Antwort. Leider kann ich das auch nicht überprüfen, weil 440 00:33:55,100 --> 00:33:58,850 die Universität Oxford die Daten dazu nicht veröffentlicht hat. Das liegt 441 00:33:58,850 --> 00:34:04,850 teilweise an der Developer API von, oder den Guidelines von Twitter. Das liegt aber 442 00:34:04,850 --> 00:34:10,109 auch daran, oder gibt es einen Ausweg da drauß: Und zwar kann man nämlich die Liste 443 00:34:10,109 --> 00:34:14,469 der Twitter IDs veröffentlichen, das darf man nämlich, und kann sich dann sozusagen 444 00:34:14,469 --> 00:34:18,899 nachträglich den Tweet nochmal holen und genauer analysieren. Zum Glück gibt es von 445 00:34:18,899 --> 00:34:24,799 der George Washington Universität eine Veröffentlichung "2016 United States 446 00:34:24,799 --> 00:34:28,690 Presidential Election Tweet IDs". Da gibt es unter anderem auch eine Liste von 447 00:34:28,690 --> 00:34:34,018 Tweets, die den Hashtag "Election Day" verwendet haben. Das heißt ich hab jetzt 448 00:34:34,018 --> 00:34:37,839 leider nicht die gleiche Datenbasis wie die Universität Oxford. Ich kann aber 449 00:34:37,839 --> 00:34:42,168 einen kleinen Ausschnitt rausnehmen und zwar mir nur angucken, wer hat am Wahltag 450 00:34:42,168 --> 00:34:48,109 mehr als 100 mal eines von diesen Hashtags verwendet plus den Hashtag "Election Day". 451 00:34:48,109 --> 00:34:56,869 Und diejenigen, die sogar mehr als 100 Mal am Wahltag getwittert haben sind diese 12, 452 00:34:56,869 --> 00:35:01,680 das sind sozusagen die laut Social Both Kriterien die die am deutlichsten als 453 00:35:01,680 --> 00:35:08,499 Social Bots sich definieren. Und wenn ihr jetzt mal wissen wollt, wer denn dieses 454 00:35:08,499 --> 00:35:12,390 Social Bots wirklich sind: Nehmen wir uns mal Zeit und gucken uns jeden einzelnen 455 00:35:12,390 --> 00:35:21,950 von diesen 12 an. Das erste ist ein @dreamedofdust, der 437 Tweets am Wahltag 456 00:35:21,950 --> 00:35:25,759 veröffentlicht hat (mit diesen erwähnten Hashtags), und was er macht: er twittert 457 00:35:25,759 --> 00:35:31,109 Links zu reddit.com/r/The_Donald zu diesen einzelnen Kommentaren. Und er benutzt 458 00:35:31,109 --> 00:35:37,920 dabei If This Then That. Und bot: klares Ja, auf jeden Fall. Was er aber dabei tut 459 00:35:37,920 --> 00:35:41,930 ist bereits veröffentlichte Kommentare im Reddit-Forum einfach nochmal in diesem 460 00:35:41,930 --> 00:35:45,460 Account zu spiegeln, und ich lehne mich mal aus dem Fenster wenn ich sage: 461 00:35:45,460 --> 00:35:50,170 Einfluss? Kaum. Also völlig kommentarlos, wie gesagt, spiegelt einfach nur Reddit- 462 00:35:50,170 --> 00:35:55,640 Kommentare. Der nächste Account, ITX News, twittert Screenshots von Texten, 463 00:35:55,640 --> 00:35:59,830 völlig abgedrehter Verschwörungsquark, also da ist, da sind Sachen dabei, die 464 00:35:59,830 --> 00:36:05,609 Queen wurde von Hindus vergiftet. Und, also wirklich, find ich völlig abgedreht. 465 00:36:05,609 --> 00:36:10,400 Und er benutzt für seine für seine Screenshots, die er dann veröffentlicht, 466 00:36:10,400 --> 00:36:17,549 immer die aktuellen trending Hashtags. Er hat vier Follower, und er ist ganz klar 467 00:36:17,549 --> 00:36:24,799 kein Bot. Der nächste Account: Er ist Trump-Supporter weil er Clinton furchtbar 468 00:36:24,799 --> 00:36:30,559 findet. Er nutzt intensiv Hashtags, lebt auf Hawaii, schläft sechs Stunden, macht 469 00:36:30,559 --> 00:36:35,349 Mittagspause - das sieht man an den an den Zeiten, wann er twittert. Und der ist auf 470 00:36:35,349 --> 00:36:41,529 jeden Fall kein Bot. Der nächste. Offensichtlich liebt er Bernie Sanders, er 471 00:36:41,529 --> 00:36:45,450 hasst Donald Trump, Hillary Clinton, die Demokraten (weil sie nämlich Hillary 472 00:36:45,450 --> 00:36:49,029 Clinton aufgestellt haben statt Bernie Sanders), Bill und Chelsea Clinton, und er 473 00:36:49,029 --> 00:36:53,979 hasst Expedia, weil Chelsea Clinton jetzt im Board sitzt. Aber ein Bot ist er nicht. 474 00:36:53,979 --> 00:36:59,370 Der nächste. Der sieht mir doch sehr fischig aus. Ich vermute mal, dass es eine 475 00:36:59,370 --> 00:37:04,759 spanischsprachige Click-Farm ist, die versucht, User auf Werbeseiten zu locken. 476 00:37:04,759 --> 00:37:10,110 Die machen dann Werbung für was weiß ich, irgendwelche Apps oder sowas, überhaupt 477 00:37:10,110 --> 00:37:13,859 gar keine politischen Inhalte, denn sie nutzen einfach nur Training Hashtags um 478 00:37:13,859 --> 00:37:17,671 sich in politischen Diskussionen sozusagen da noch nochmal ihre Links zu 479 00:37:17,671 --> 00:37:23,410 veröffentlichen, haben einen Follower. Ob es ein Bot ist oder nicht? Ich sag mal, 480 00:37:23,410 --> 00:37:28,119 vermutlich nicht. Da sind halt Tippfehler drin, das wäre eigentlich ein schlecht 481 00:37:28,119 --> 00:37:31,559 programmierter Bot (oder besonders schlau). Im Zweifelsfall könnt ihr ihn 482 00:37:31,559 --> 00:37:35,421 gern als Bot definieren, aber impact hat er keinen. Jetzt wird es ein bisschen 483 00:37:35,421 --> 00:37:39,579 spannender. Ave Hurley ist eine Oma aus Brooklyn, sie ist eine Künstlerin, malt 484 00:37:39,579 --> 00:37:43,201 Bilder, macht Schmuck, verkauft sie in einem Shop und hat vor kurzem mit dem 485 00:37:43,201 --> 00:37:49,810 Rauchen aufgehört. An dem Wahltag hat sie wie wild für Trump getwittert und hat ihn 486 00:37:49,810 --> 00:37:53,390 unterstützt und hat versucht, Leute zu überzeugen. Aber ein Bot ist sie auch 487 00:37:53,390 --> 00:37:58,650 nicht. Dann hab ich hier noch den hier. Der ist aus Tokio. Ich vermute es ist ein 488 00:37:58,650 --> 00:38:03,160 Student, der twittert auf Japanisch und ab dem Moment war ich so ein bisschen Lost in 489 00:38:03,160 --> 00:38:07,719 Translation um herauszukriegen, was er da möchte. Aber ich vermute, dass er Toru 490 00:38:07,719 --> 00:38:12,609 Hashimoto und Kazuma Ieri hasst, das eine ist ein Politiker, das andere ein 491 00:38:12,609 --> 00:38:19,190 Internet Entrepreneur. Er hat am Wahlabend auf einen Tweet zu Kazuma gefeuert, muss 492 00:38:19,190 --> 00:38:22,720 man sagen, und hat da einfach die aktuellen Trending hashtags genommen, und 493 00:38:22,720 --> 00:38:28,869 da war natürlich auch die Election dabei, aber ein Bot ist es nicht. Der nächste: 494 00:38:28,869 --> 00:38:34,099 Paolo. Paolo kann 13 Tweets in drei Sekunden schicken. 495 00:38:34,099 --> 00:38:44,039 *Gelächter* *Applaus* 496 00:38:44,039 --> 00:38:48,530 Er nutzt dafür drei unbekannte italienische Twitter-Services, einer davon 497 00:38:48,530 --> 00:38:53,390 ist in der Zwischenzeit gesperrt. Pro Hillary. Tweets werden so gut wie gar 498 00:38:53,390 --> 00:38:58,200 nicht gefavt und retweetet. Ein Bot ist er auf jeden Fall, aber einen Einfluss hat 499 00:38:58,200 --> 00:39:03,220 er, glaube ich zumindest, keinen. Dann haben wir noch den hier. Er liebt Jesus, 500 00:39:03,220 --> 00:39:07,579 Die Familie, Trump, Wikileaks, Fox News, und Waffen. 501 00:39:07,579 --> 00:39:12,549 *Gelächter* Hasst Abtreibung, Feminismus, Hillary 502 00:39:12,549 --> 00:39:19,410 Clinton, CNN, und Obamacare. Aber ein Bot ist es nicht. Dann haben wir auch 503 00:39:19,410 --> 00:39:26,369 PresidentDrumf. Der ist ein Satire- Account. Teilweise witzig, hat trotzdem 504 00:39:26,369 --> 00:39:28,380 nur einen Follower. *Gelächter* 505 00:39:28,380 --> 00:39:35,640 Aber ein Bot ist es auch nicht. Dann haben wir noch Maryke. Sie ist Journalistin aus 506 00:39:35,640 --> 00:39:40,819 Südafrika, arbeitet für die französische Presseagentur AFP, und hat über Election 507 00:39:40,819 --> 00:39:47,509 Day live getwittert an dem Abend. Und sie ist auch kein Bot. Dann haben wir noch ein 508 00:39:47,509 --> 00:39:53,349 Dr. Van Nostrand. Ich habe leider kein Bild von ihm gefunden, aber er liebt 509 00:39:53,349 --> 00:40:00,609 Baseball, American Football, Fox News und Trump. Er hasst Hillary und Bill Clinton, 510 00:40:00,609 --> 00:40:07,059 CNN, Islam, Feministen, und Linke. Und er verfolgte Trumps' Sieg live. Hat den 511 00:40:07,059 --> 00:40:13,200 Wahltag intensiv verfolgt und begleitet, aber ein Bot ist er auch nicht. So, und 512 00:40:13,200 --> 00:40:18,660 das war jetzt der zwölfte von den zwölf. Fassen wir mal zusammen. Ich habe ja mal 513 00:40:18,660 --> 00:40:23,140 so ein kleines Tabelle gemacht, spaltenweise pro Clinton, neutral, pro 514 00:40:23,140 --> 00:40:27,940 Trump, und zeilenweise ist es ein Mensch, sind wir uns nicht ganz sicher, oder ist 515 00:40:27,940 --> 00:40:31,530 es ein Social Bot. Wir haben auf jeden Fall ein Social Bot gefunden der pro- 516 00:40:31,530 --> 00:40:35,386 Clinton ist, und wir haben einen Social Bot gefunden von pro-Trump ist, ob es sich 517 00:40:35,386 --> 00:40:39,309 tatsächlich um einen Social Bot handelt wäre ich sehr vorsichtig denn sie haben ja 518 00:40:39,309 --> 00:40:42,907 keine soziale Interaktion bewiesen, sondern alles was sie gemacht haben ist 519 00:40:42,907 --> 00:40:46,530 automatisiert Links und Nachrichten zu veröffentlichen, und hatten auch dabei 520 00:40:46,530 --> 00:40:51,039 nicht wirklich einen Impact weil keiner sie retweetet oder gefavt hat. Eine große 521 00:40:51,039 --> 00:40:58,799 Gruppe die wir gefunden haben waren pro- Trump-Menschen, die alle, auf der pro- 522 00:40:58,799 --> 00:41:03,790 Clinton Seite haben wir nur einen Satire- Account gefunden. Und dazwischen im 523 00:41:03,790 --> 00:41:08,259 neutralen Bereich einen Bernie Sanders- Fan, eine Journalistin, einen Japaner und 524 00:41:08,259 --> 00:41:15,630 einen Verschwörungstheoretiker. Und dann haben wir noch hier unsure derjenige der 525 00:41:15,630 --> 00:41:19,780 seine Links zu App-Webseiten vertreibt. Wenn ich jetzt mal hervorhebe von denen 526 00:41:19,780 --> 00:41:23,139 Accounts von denen ich glaube dass sie tatsächlich an einer politischen 527 00:41:23,139 --> 00:41:27,039 Diskussion teilgenommen haben... sind das die hier und das sind alles Menschen. Ist 528 00:41:27,039 --> 00:41:41,700 nur die Hälfte, aber ja. Die Studie "Bots and Automation over Twitter during U.S. 529 00:41:41,700 --> 00:41:45,689 Election" müsste eigentlich heißen "Highly active Twitter users during US Election". 530 00:41:47,079 --> 00:41:51,019 Social Bots, oder als was wir sie bezeichnet haben, sind politisch aktive 531 00:41:51,019 --> 00:41:58,450 Bürger, Hashtag-Spam, Medien und Journalisten, und einige simple Bots. Auf 532 00:41:58,450 --> 00:42:02,900 Vollständigkeit halber habe ich versucht noch eine Studie zu finden die eine andere 533 00:42:02,900 --> 00:42:09,209 Methodik verwendet. Und da gibt es von der University of South California "Social 534 00:42:09,209 --> 00:42:15,710 bots distort the 2016 U.S. Presidential election online discussion", und was sie 535 00:42:15,710 --> 00:42:20,000 zur Identifizierung von Social Bots verwenden ist ein Service der nennt sich 536 00:42:20,000 --> 00:42:25,139 BotOrNot, in der Zwischenzeit umbenannt in Botometer. Und ich will da nicht zu tief 537 00:42:25,139 --> 00:42:28,799 einsteigen, da gibt's auch nochmal ein Paper dazu, aber was sie im Kern machen 538 00:42:28,799 --> 00:42:32,370 ist im Prinzip das was ich am Anfang gemacht habe – sie versuchen die ganzen 539 00:42:32,370 --> 00:42:36,420 Metadaten rund um einen Account zu kategorisieren, und dann kommt da Machine 540 00:42:36,420 --> 00:42:39,839 Learning oben drauf, und dann wird versucht mit einer Wahrscheinlichkeit 541 00:42:39,839 --> 00:42:44,130 abzuschätzen ob nun ein Account nun ein Bot ist oder nicht, und das ist die Basis 542 00:42:44,130 --> 00:42:48,329 dieser Studie. Ich hab das mal... Unten ist noch mal der Link dazu, falls einer da 543 00:42:48,329 --> 00:42:52,640 selber mit spielen möchte. Vorsichtig, man muss dazu seinen Twitter-Account 544 00:42:52,640 --> 00:42:56,419 autorisieren und das ist dann... der im Gegensatz zu uns keine Leserechte haben 545 00:42:56,419 --> 00:42:59,720 möchte, sondern er möchte auch Schreibrechte haben; für den Fall falls 546 00:42:59,720 --> 00:43:03,499 die gehackt werden, werdet ihr also auch irgendwie Scheiße twittern. Ich hab 547 00:43:03,499 --> 00:43:06,079 einfach mal ein paar Accounts rein geworfen um zu gucken wie vertrauenswürdig 548 00:43:06,079 --> 00:43:09,859 das ist; da habe ich jetzt einfach mal einen erdgeist und einen Frank Rieger und 549 00:43:09,859 --> 00:43:13,970 einen Linuzifer rein geworfen. Das Kriterium übrigens der Studie ist 50%, 550 00:43:13,970 --> 00:43:17,450 alle die unter 50% sind, sind Menschen, alle die über 50% 551 00:43:17,450 --> 00:43:23,450 sind, sind Bots. Gegenübergestellt hab ich nochmal das BMVI, das Bundesministerium 552 00:43:23,450 --> 00:43:32,299 für Justiz und Verbraucherschutz – 55 Prozent, das BKA ist ein Social Bot. 553 00:43:32,299 --> 00:43:36,509 *Applaus* Und vielleicht liegt das an den deutschen 554 00:43:36,509 --> 00:43:40,630 Accounts, da die Studie sich im Speziellen mit den US-Wahlen beschäftigt haben, hab 555 00:43:40,630 --> 00:43:44,680 ich da mal stichprobenartig ein paar rein geworfen. Da haben wir das Wall Street 556 00:43:44,680 --> 00:43:48,849 Journal, LA Times ist ein Bot, CNN und Fox News ist ein Bot, realDonaldTrump ist ein 557 00:43:48,849 --> 00:43:51,869 Bot, und der amerikanische Präsident. *Lachen* 558 00:43:51,869 --> 00:43:59,989 *Applaus* Das könnt ihr ja auch alles selber 559 00:43:59,989 --> 00:44:04,140 ausprobieren. Also wissenschaftlich ist das alles nicht haltbar. 560 00:44:05,319 --> 00:44:06,972 Und wen das noch nicht überzeugt, 561 00:44:06,972 --> 00:44:12,602 Hegelich erwartet keine große Gefahr durch Social Bots im Wahlkampf. 562 00:44:13,410 --> 00:44:20,309 Zusammenfassung. Social Bot, Filterblasen, Fake News. Ich versuche 563 00:44:20,309 --> 00:44:24,070 versuch's mal vorsichtig zu formulieren: die Forschung ist noch in den Anfängen. 564 00:44:24,070 --> 00:44:28,369 Die Methodiken sind neu, teilweise experimentell, und müssen noch überprüft 565 00:44:28,369 --> 00:44:32,319 werden. Und im Speziellen müssen die wissenschaftlichen Publikation überprüft 566 00:44:32,319 --> 00:44:37,299 werden. Falls einer irgendwie in dem Thema gerade arbeitet, den kann ich das ans Herz 567 00:44:37,299 --> 00:44:42,119 legen, als Bachelor- oder Masterarbeit mal ans Herz zu legen, diese Studien 568 00:44:42,119 --> 00:44:45,789 tatsächlich zu überprüfen. Was ich bei Social Bots, Filterblase und Fake News 569 00:44:45,789 --> 00:44:53,180 gefunden habe sind exemplarisch: Egon Dombrowski und Ave Hurley. Wir haben in 570 00:44:53,180 --> 00:44:59,039 den Diskursen die Leute als Nazis, bildungsfern, sozial abgehängt, 571 00:44:59,039 --> 00:45:04,219 Mittelschicht mit Verlustängsten und jetzt auch neu als Social Bots bezeichnet. 572 00:45:04,219 --> 00:45:05,989 Aber was sie alle gemeinsam haben: 573 00:45:05,989 --> 00:45:07,750 Sie haben Angst und sie sind wütend. 574 00:45:07,750 --> 00:45:10,370 Und sie haben Vertrauensverlust in die Institutionen. 575 00:45:10,370 --> 00:45:12,519 Und was wir beobachten ist das neue 576 00:45:12,519 --> 00:45:18,180 gesellschaftliche Gruppen in die sozialen Netzwerke betreten, und sie nutzen ihr 577 00:45:18,180 --> 00:45:23,119 Recht und die Möglichkeit ihrer Meinungsäußerung. Und im Zweifelsfall 578 00:45:23,119 --> 00:45:29,511 greifen sie auch auf Fake News zurück wenn es ihre Ansichten bestätigt. 579 00:45:29,511 --> 00:45:33,330 Was wir aber beobachten ist, dass die sozialen Netzwerke nicht geeignet sind, um 580 00:45:33,330 --> 00:45:37,319 gesellschaftliche Lösungen zu entwickeln. Vielleicht gibt es irgendwann technische 581 00:45:37,319 --> 00:45:42,339 Lösungen. Wer weiß. Vielleicht gehört es aber in Zukunft auch zur Medienkompetenz, 582 00:45:42,339 --> 00:45:47,859 eine gewisse Debattenkultur zu entwickeln. Ich weiß es nicht. Das ist auf jeden Fall, 583 00:45:47,859 --> 00:45:51,229 ich will jetzt den Begriff "Neuland" nicht verwenden, das auf jeden Fall ein neues 584 00:45:51,229 --> 00:45:55,630 Forschungsgebiet. Wir sehen glaube ich dass hier eine neue Wissenschaft beginnt 585 00:45:55,630 --> 00:45:59,609 zu entstehen. Sie steckt noch in den Kinderschuhen, aber sie macht gerade einen 586 00:45:59,609 --> 00:46:03,819 fundamentalen Wandel mit, von einer ideographischen Wissenschaft, also einer 587 00:46:03,819 --> 00:46:07,529 reinen Phänomen beschreibenden, wie Sozialwissenschaft, Kulturwissenschaft 588 00:46:07,529 --> 00:46:11,680 oder Politikwissenschaften, hin zu einer nomothetischen Wissenschaft, die versucht 589 00:46:11,680 --> 00:46:16,160 Regeln zu erkennen, Gesetze zu entdecken, reproduzierbare Ergebnisse zu entwickeln, 590 00:46:16,160 --> 00:46:20,750 so wie man das aus den Naturwissenschaften kennt. Ähnliche Entwicklungen haben wir 591 00:46:20,750 --> 00:46:25,249 auch gesehen, die Astrologie, das war die Lehre von den Sternen, bis dann das 592 00:46:25,249 --> 00:46:29,110 Teleskop erfunden wurde und wir nun anfangen konnten, Gesetze in der Bewegung 593 00:46:29,110 --> 00:46:32,650 von Planeten und Sternen zu entdecken, die reproduzierbar sind. Und aus der 594 00:46:32,650 --> 00:46:38,700 Astrologie wurde dann die Astronomie. Ich sehe, dass wir in den Debatten, die jetzt 595 00:46:38,700 --> 00:46:44,209 in den sozialen Netzwerken stattfinden, eine neue Wissenschaft haben können die 596 00:46:44,209 --> 00:46:49,049 sich mit diesem Thema beschäftigt. Und ich glaube das ist nicht nur möglich ist, 597 00:46:49,049 --> 00:46:53,020 sozusagen als Teleskop oder Mikroskop die für die Gesellschaft, sondern dass es auch 598 00:46:53,020 --> 00:46:58,090 notwendig ist. Und dazu ist viel Forschung nötig und ich animiere jeden, der nicht so 599 00:46:58,090 --> 00:47:01,900 richtig weiß ob er jetzt in dem geisteswissenschaftlichen Bereich oder im 600 00:47:01,900 --> 00:47:05,299 Data Science-Bereich arbeiten möchte, diese beiden Welten miteinander zu 601 00:47:05,299 --> 00:47:12,180 verbinden. Bachelor und Master sind, Arbeiten sind da gut definitiv 602 00:47:12,180 --> 00:47:17,469 prädestiniert um diese wissenschaftlichen Ausarbeitungen zu reproduzieren. Und diese 603 00:47:17,469 --> 00:47:21,649 Studien von der Oxford-Universität oder von South California zu reproduzieren 604 00:47:21,649 --> 00:47:25,630 und zu validieren. Und ich würde das gerne unterstützen, und ich hoffe, die nächsten 605 00:47:25,630 --> 00:47:29,380 zweieinhalb Tage noch Zeit zu finden, Teile meines Frameworks und auch der 606 00:47:29,380 --> 00:47:36,509 Rohdaten zu veröffentlichen. Ansonsten bin ich die nächsten zweieinhalb Tage zu 607 00:47:36,509 --> 00:47:41,170 erreichen: DECT Telefonnummer 360, 3600 Entschuldigung, und Twitter-Account, 608 00:47:41,170 --> 00:47:45,839 @michaelkreil. Ich würde gerne andere Leute, die in dem Bereich forschen oder 609 00:47:45,839 --> 00:47:53,049 sowas zusammenbringen um zu gucken ob wir zum Thema Social Bot da nicht mal eine 610 00:47:53,049 --> 00:48:09,869 Wissenschaftssprache Debatte starten können. Danke schön. 611 00:48:09,869 --> 00:48:16,200 *Applaus* Herald: Mindestens das will ich nachher 612 00:48:16,200 --> 00:48:19,839 nochmal hören. Jetzt haben wir noch, ja, etwas über ne Viertelstunde Zeit für 613 00:48:19,839 --> 00:48:24,599 Fragen und Antworten. Habt ihr Fragen an Michael Kreil? Positioniert euch bitte an 614 00:48:24,599 --> 00:48:29,709 den Mikrophonen, ich versuche einigermaßen ausgeglichen auszuwählen. Falls schon 615 00:48:29,709 --> 00:48:33,339 irgendwo jemand steht, steht schon irgendwo jemand, hebt mal die Hand? Ah, da 616 00:48:33,339 --> 00:48:37,390 hinten. Mikrophon 4, fang an. Mikrophon 4: Jawohl. Ich hab eine Frage 617 00:48:37,390 --> 00:48:45,549 bezüglich State-sponsored Propaganda, also die sind wirklich Leute, die bezahlt 618 00:48:45,549 --> 00:48:52,320 werden von Staaten, damit die Propaganda betreiben. Habt ihr auch in der Forschung 619 00:48:52,320 --> 00:48:55,609 diebezüglich was rausgefunden, oder habt ihr das überhaupt untersucht? 620 00:48:55,609 --> 00:49:01,199 MK: Wir haben versucht, Leute zu finden, die an den Bots, die an den politischen 621 00:49:01,199 --> 00:49:04,660 Diskursen teilnehmen. Ob sie jetzt tatsächlich dafür bezahlt werden oder 622 00:49:04,660 --> 00:49:09,589 nicht ist unmöglich festzustellen. Wir sehen aber, wenn jetzt zum Beispiel jemand 623 00:49:09,589 --> 00:49:15,129 bei der US-Wahl was postet und dann aber in den nächsten Monaten bis heute noch 624 00:49:15,129 --> 00:49:18,680 ganz normales Leben auf den, in den sozialen Netzwerken führt, und parallel 625 00:49:18,680 --> 00:49:22,400 dann auch noch auf Facebook oder sowas, gehen wir eher davon aus, dass es sich 626 00:49:22,400 --> 00:49:27,040 nicht um einen bezahlten Akteur oder Akteure handelt. Die große Frage, die ich 627 00:49:27,040 --> 00:49:30,759 mir eigentlich auch stelle ist dabei: Was ist der tatsächliche impact, also die 628 00:49:30,759 --> 00:49:35,749 Unterstellung mit jemand bezahlt da irgendwie, kann ich wirklich auf Twitter 629 00:49:35,749 --> 00:49:39,329 durch soziale Interaktion Leute davon überzeugen, die politische Richtung zu 630 00:49:39,329 --> 00:49:43,049 wechseln? Das ist eine bisherige Unterstellung, die noch nicht überprüft 631 00:49:43,049 --> 00:49:46,780 wurde, und deswegen finde ich das vorsichtig, bin ich da vorsichtig, sowas 632 00:49:46,780 --> 00:49:50,009 anzunehmen. H: Mikro 2. 633 00:49:50,009 --> 00:49:54,220 M2: Vielen, vielen Dank für den großartigen Vortrag, ich fand' das super 634 00:49:54,220 --> 00:49:57,550 wichtig, anhand von dem kann man eigentlich sehen, was sich wirklich an 635 00:49:57,550 --> 00:50:01,309 wissenschaftlichen Methodiken verändern muss, und von daher vielen, vielen Dank. 636 00:50:01,309 --> 00:50:05,079 Ich habe eine Frage, ich habe mich gerade gefragt, ob man wirklich von Fake News 637 00:50:05,079 --> 00:50:08,791 sprechen sollte, weil offensichtlich spiegeln diese Nachrichten ja nur, was die 638 00:50:08,791 --> 00:50:14,309 Verbreiter und weiteren Re-tweeter der Nachrichten hören oder sehen oder wissen 639 00:50:14,309 --> 00:50:18,319 wollen, also das, was sie eigentlich schon denken, wird quasi nur gespiegelt. Und ich 640 00:50:18,319 --> 00:50:22,229 hab mich gefragt, ob es nicht irreführend ist, dieses Wort "News", und ob man nicht 641 00:50:22,229 --> 00:50:25,760 ein neues Wort dafür finden müsste. MK: Auf jeden Fall, auf jeden Fall. Wir 642 00:50:25,760 --> 00:50:30,699 haben auch zum Beispiel gesehen, dass bei der US-Wahl relativ viele Fake News aus 643 00:50:30,699 --> 00:50:34,650 einer Stadt aus Osteuropa kommt, die aber gar keine politische Agenda haben, sondern 644 00:50:34,650 --> 00:50:38,309 einfach nur Geld damit verdient haben, dass ihre Posts sich so weit verbreitet 645 00:50:38,309 --> 00:50:42,459 haben, und damit klick-Werbung, verstanden haben, Geld gewonnen haben. Da war 646 00:50:42,459 --> 00:50:47,829 überhaupt kein politischer, gar kein politisches Ziel dahinter, im Gegenteil, 647 00:50:47,829 --> 00:50:51,550 laut eigener Aussage haben sie erst pro- Clinton probiert, aber das hat einfach 648 00:50:51,550 --> 00:50:56,019 nicht so gut eingeschlagen wie pro-Trump- Sachen. Deswegen halte ich auch den 649 00:50:56,019 --> 00:51:00,440 Begriff von Fake News dann auch nicht mehr für angebracht. 650 00:51:00,440 --> 00:51:03,809 H: So, aus dem Internet haben wir auch eine Frage. 651 00:51:03,809 --> 00:51:08,229 Signal-Engel: Ja, zuerst auch aus dem IRC großes Lob an den Vortrag, es wurde 652 00:51:08,229 --> 00:51:12,529 angemerkt, es sei sehr interessant, mal den Hashtag #34c3 zu analysieren und 653 00:51:12,529 --> 00:51:18,050 Trolle aufzudecken. Cyberrichter und Afdex lässt fragen: Gibt es schon schlaue Bots 654 00:51:18,050 --> 00:51:21,769 mit Einfluss, ist irgendwas über die Interaktion untereinander bekannt, gibt es 655 00:51:21,769 --> 00:51:33,180 bald Bot Wars? MK: Äh. Flame-Bots, ja, äh. Das sind alles 656 00:51:33,180 --> 00:51:38,879 theoretische Konzepte. Wenn man sich die Studien dazu durchliest, das sind alles 657 00:51:38,879 --> 00:51:42,539 Konzepte "es könne irgendwann mal so sein". Ich stehe auch nicht hier und sage 658 00:51:42,539 --> 00:51:46,549 "sowas wird nie passieren" oder sowas. Keine Ahnung, was es für Entwicklungen mit 659 00:51:46,549 --> 00:51:52,450 KI in den nächsten Tagen oder Monaten oder so gibt. Aber das, was wir jetzt bisher 660 00:51:52,450 --> 00:51:56,709 sehen konnten, waren jetzt nicht irgendwelche KI's, die durchs Internet 661 00:51:56,709 --> 00:52:00,239 laufen. H: Die 3. 662 00:52:00,239 --> 00:52:07,039 M3: Servus. Wunderbar, funktioniert. Das erste harte Kriterium, das mir einfallen 663 00:52:07,039 --> 00:52:11,059 würde, um Bot-Accounts von Menschen- Accounts zu trennen wäre die posting- 664 00:52:11,059 --> 00:52:14,720 Frequenz, und die hat jetzt hier nur einmal Einfluss gefunden - woran liegt 665 00:52:14,720 --> 00:52:17,289 das? MK: Weil sie tatsächlich auch nur einmal 666 00:52:17,289 --> 00:52:25,729 auffällig war. Also, die anderen Accounts, also ich meine, wenn ich jetzt nen Social 667 00:52:25,729 --> 00:52:29,809 Bot entwickle, dann wäre ich jetzt auch schlau zu sagen okay, dann haut der jetzt 668 00:52:29,809 --> 00:52:35,450 nicht alle halbe Sekunde nen tweet raus, wenn ich sowas bauen würde. Aber in diesem 669 00:52:35,450 --> 00:52:39,250 Fall ist es tatsächlich nur einmal aufgetreten, das ein Bot sozusagen den Bug 670 00:52:39,250 --> 00:52:43,410 hatte, das zu tun. M3: Okay, taugt also nicht. Super, danke. 671 00:52:43,410 --> 00:52:47,609 H: Und MIkro 1. M1: Hallo erstmal, ja, jetzt geht's. Ich 672 00:52:47,609 --> 00:52:51,049 wollte fragen ob, weil du ja gesagt hattest dass bei den Social Bots ja 673 00:52:51,049 --> 00:52:54,949 eigentlich der Einfluss sich verliert, ob das dann wiederum heißen könnte, dass die 674 00:52:54,949 --> 00:52:59,349 eigentliche Gefahr von Filterblasen, dass kein Meinungsdiskurs entsteht, oder dass 675 00:52:59,349 --> 00:53:03,789 der halt eingedämmt wird, ob das sich dann verliert oder ob du in den Forschungen 676 00:53:03,789 --> 00:53:07,459 gesehen hast, dass die Gefahr gar nicht so da ist, wie sie irgendwie überall 677 00:53:07,459 --> 00:53:12,009 propagiert wird? Ja. MK: Also, zum Einen: Ich glaube, es gibt 678 00:53:12,009 --> 00:53:15,600 so einen Satz, den man in den letzten 10 Jahren immer wieder gehört hat, das 679 00:53:15,600 --> 00:53:18,460 Internet ist nicht an bestimmten Sachen schuld, sondern das Internet macht nur 680 00:53:18,460 --> 00:53:22,339 einfach wieder Sachen sichtbar. Und ich glaube, dass es eine Menge Leute gibt, die 681 00:53:22,339 --> 00:53:27,231 sich gerne an einem politischen Diskurs beteiligen wollen und nicht die 682 00:53:27,231 --> 00:53:31,319 Möglichkeit hatten, und jetzt nun mit den sozialen Netzen diese Möglichkeit haben, 683 00:53:31,319 --> 00:53:34,479 und dann als Bots klassifiziert werden. Problem ist, dass ich deine Frage 684 00:53:34,479 --> 00:53:35,780 vergessen habe. 685 00:53:35,780 --> 00:53:37,690 M1: Ich wollte eigentlich nur wissen, ob 686 00:53:37,690 --> 00:53:41,079 diese Gefahr, dass man halt sagt, der Diskurs ist so ein bisschen eingedämmt, 687 00:53:41,079 --> 00:53:44,891 weil jeder in seiner eigenen Blase lebt, ob sich das nicht dadurch verliert, weil 688 00:53:44,891 --> 00:53:49,309 du ja gesagt hattest, Social Bots sind unwirksam so wirklich, ob das nicht dann 689 00:53:49,309 --> 00:53:52,839 sich auch sozusagen auf das andere übertragen lässt für unsere, für unseren 690 00:53:52,839 --> 00:53:56,701 normane Gebrauch. MK: Genau, also, ich, kann ich, kann ich 691 00:53:56,701 --> 00:54:01,290 keine abschließende Meinung zu abgeben. Ich weiß aber dass, oder man merkt es 692 00:54:01,290 --> 00:54:05,180 halt, dass die sozialen Netze oft, oder fast immer nicht dazu geeignet sind, 693 00:54:05,180 --> 00:54:08,510 tatsächlich einen Diskurs zu führen, sondern es gibt halt, es ist halt, 694 00:54:08,510 --> 00:54:12,139 endet immer in einem Flame War, sind sozusagen, "du bist, ihr seid die Bösen, 695 00:54:12,139 --> 00:54:15,808 und wir sind die Guten." Aber tatsächlich irgendwie eine Lösung zu entwickeln, 696 00:54:15,808 --> 00:54:18,029 eignet sich nicht dafür, vielleicht ist der Mensch auch nicht dafür gemacht. 697 00:54:18,029 --> 00:54:22,279 Vielleicht haben Netzwerke nen, nen bestimmten flaw, den wir halt noch nicht 698 00:54:22,279 --> 00:54:24,979 kennen, man darf ja auch nicht vergessen, das ist eine extrem experimentelle 699 00:54:24,979 --> 00:54:29,930 Technologie. Noch nie gab es ein Netzwerk, das weltübergreifend so vielen Menschen 700 00:54:29,930 --> 00:54:32,819 die Möglichkeit gibt, miteinander zu kommunizieren und Diskurse zu führen. 701 00:54:32,819 --> 00:54:35,369 M1: Danke. H: Mikro 4. 702 00:54:35,369 --> 00:54:40,789 M4: Ja, Hallo. Erstmal Kompliment für diesen superwichtigen und sehr coolen 703 00:54:40,789 --> 00:54:44,730 Vortrag. Meine Frage: Du hattest ja jetzt ausschließlich über Twitter gesprochen - 704 00:54:44,730 --> 00:54:48,420 habt ihr mal Analysen gefahren über andere soziale Netze, die ja durchaus auch 705 00:54:48,420 --> 00:54:54,340 Verbreitung haben, speziell dazu, auch nicht nur über die Anzahl der Tweets 706 00:54:54,340 --> 00:54:58,069 sondern auch über den Impact, weil die Frage ist ja, die hattest du ja mehrfach 707 00:54:58,069 --> 00:55:01,450 aufgeworfen, was wirkt eigentlich eine Tweet, wenn die, wenn die einen 708 00:55:01,450 --> 00:55:05,369 veröffentlichen, also ein Tweet auf 10.000 Follower könnte möglicherweise wichtiger 709 00:55:05,369 --> 00:55:10,170 sein als 10.000 Tweets mit einem Follower. MK: Genau, da kann man sich halt Metriken 710 00:55:10,170 --> 00:55:14,790 überlegen. Normalerweise ist es für mich halt ein Ausschlusskriterium, wenn ein 711 00:55:14,790 --> 00:55:19,009 Tweet nur, nicht gefavt wird und nicht retweetet wird, das ist für mich, das ist 712 00:55:19,009 --> 00:55:22,349 ein Ausschlusskriterium. Was der tatsächliche Impact ist, obs dafür ne 713 00:55:22,349 --> 00:55:27,920 Metrik gibt, weiß ich nicht. Kann man sich überlegen, wie gesagt, neue Wissenschaft. 714 00:55:27,920 --> 00:55:33,190 Das andere ist, andere soziale Netzwerke. Man sieht, dass auf YouTube ne Menge 715 00:55:33,190 --> 00:55:37,819 passiert. Ganz viele Leute packen im Wohnzimmer die Kamera aus und teilen ihre 716 00:55:37,819 --> 00:55:42,180 politischen Meinungen im Wohnzimmer und veröffentlichen das auf YouTube, es gibt 717 00:55:42,180 --> 00:55:47,839 auch dieses russische Social Network, wie heißt das? VKan... VKan-irgendwas, ja. 718 00:55:47,839 --> 00:55:54,279 Genau, da gibt es - VKontakte, genau - da gibt es auch, kenne ich eine Gruppe die 719 00:55:54,279 --> 00:55:57,980 sich damit beschäftigt hat, wie das da aussieht, das ist aber ein sehr kleiner 720 00:55:57,980 --> 00:56:04,459 Teil, der große Brocken ist natürlich Facebook, und Facebook hat zwei Probleme: 721 00:56:04,459 --> 00:56:08,720 Erstens gibt es eine Menge geschlossene Gruppen wo viel stattfindet, da habe ich 722 00:56:08,720 --> 00:56:12,310 mal rein geguckt, sind die gleichen Themen, es geht halt auch um Asylpolitik 723 00:56:12,310 --> 00:56:16,250 und so weiter. Und das andere Problem mit Facebook ist, die API ist leider nicht so 724 00:56:16,250 --> 00:56:20,380 offen. Es gibt Schwierigkeiten, da große Mengen an Daten rauszuholen. Ich glaube 725 00:56:20,380 --> 00:56:25,749 dass Facebook in diesem Bereich wahnsinnig viel Datenmaterial hat und Forschung dazu 726 00:56:25,749 --> 00:56:29,680 betreiben könnte, aber leider halt nur innerhalb eines Konzerns und nicht 727 00:56:29,680 --> 00:56:32,439 innerhalb der Forschungsgemeindschaft. M4: Okay, danke. 728 00:56:32,439 --> 00:56:36,089 H: Unser Social Bot hat auch noch eine Frage. 729 00:56:36,089 --> 00:56:41,170 Signal: Mie lässt fragen, ob es Studien zu dem realen Ausmaß und dem realen Impact 730 00:56:41,170 --> 00:56:45,089 von Fake News in den sozialen Medien, und wurden die eventuell zur Legitimation des 731 00:56:45,089 --> 00:56:49,079 NetzDGs herangezogen? MK: Habe ich akustisch nicht verstanden. 732 00:56:49,079 --> 00:56:54,089 Signal: Gibt es Studien über das reale Ausmaß von Fake News und wurden die 733 00:56:54,089 --> 00:56:56,219 herangezogen zur Legitimisierung des NetzDGs? 734 00:56:56,219 --> 00:57:03,219 MK: Soweit ich weiß ist mir, mir ist keine Studie bekannt, aus meiner Erfahrung würde 735 00:57:03,219 --> 00:57:07,250 ich sagen: Sie haben keinen Einfluss, weil sie halt erstmal nicht Leute überzeugen, 736 00:57:07,250 --> 00:57:10,849 ich glaube die Leute kommen schon mit einer Überzeugung in die Netzwerke und 737 00:57:10,849 --> 00:57:15,279 werden einfach nur noch weiter zusätzlich bestätigt. Ich glaube, dass es einen 738 00:57:15,279 --> 00:57:20,019 gewissen Impact gibt mit Leuten, die sozusagen Latent ne Sorge um 739 00:57:20,019 --> 00:57:24,650 Flüchtlingspolitik haben und dann nur noch in einer Filterblase stecken und nur noch 740 00:57:24,650 --> 00:57:28,519 mit Flüchtlingskriminalität bombardiert werden. Dass sie dazu dann auch neigen, 741 00:57:28,519 --> 00:57:32,429 eine Angst gegen beispielsweise Migranten zu entwickeln. Aber eine Studie dazu ist 742 00:57:32,429 --> 00:57:35,529 mir noch nicht bekannt, wie das tatsächlich, ob das psychologische 743 00:57:35,529 --> 00:57:39,220 Auswirkungen auf die Menschen hat. H: Und die 2. 744 00:57:39,220 --> 00:57:45,910 Frage M2: Ja hallo, danke für den Vortrag. Du hattest am Anfang so einen schöne 745 00:57:45,910 --> 00:57:49,539 Karte, wo verschiedene Gruppen aus dem Twitternetzwerk aufgezeigt wurden, und 746 00:57:49,539 --> 00:57:53,690 dann hast du gezeigt, da sitzt die AfD und dann kam der Switch und da sind die 747 00:57:53,690 --> 00:57:57,949 Fakenews. Wie hast du denn ermittelt, dass diese Tweets Fakenews waren? 748 00:57:57,949 --> 00:58:01,619 Antwort: Also konkret, ich habe mir Fakenews ausgesucht und hab geguckt wer 749 00:58:01,619 --> 00:58:05,949 sie auf Twitter teilt. Also andersrum, ich hab mir sozusagen Geschichten rausgesucht, 750 00:58:05,949 --> 00:58:09,880 von denen ich weiß dass es Fakenews sind und habe dann beispielsweise Blogpost und 751 00:58:09,880 --> 00:58:14,029 so weiter die es verbreitet haben und diese URL... also wer twittert im Prinzip 752 00:58:14,029 --> 00:58:18,369 Fakenews und genau, dadurch kam dann diese Einfärbung zustande. 753 00:58:18,369 --> 00:58:22,829 H: Mikro 3. M3: Ja ich hab noch ein Frage zu 754 00:58:22,829 --> 00:58:26,889 Antworten, also ich hab oft gehört von Journalisten die sich beschwert haben, 755 00:58:26,889 --> 00:58:30,510 wenn sie über ein bestimmtes Thema berichtet haben, dass da irgendwelche Bots 756 00:58:30,510 --> 00:58:34,239 sie mit Antworten zumüllen oder sowas. Hast du sowas beobachten können wird das 757 00:58:34,239 --> 00:58:37,959 irgendwie als Megafon eingesetzt um dann einfach nochmal ein bisschen mehr Bums 758 00:58:37,959 --> 00:58:41,449 oder Druck zu machen auf solche Accounts? Gibt's das was oder ist das auch 759 00:58:41,449 --> 00:58:44,809 eigentlich alles echte Menschen die wirklich wütend sind? 760 00:58:44,809 --> 00:58:49,499 MK: Ich sag noch nicht, dass das alles echte Menschen sind, also ich kann mit 761 00:58:49,499 --> 00:58:57,330 einem Bot zum Beispiel immer einen Hashtag unbenutzbar machen. Ich kann mir einen 762 00:58:57,330 --> 00:59:00,890 Hashtag raussuchen und kann das dann mit Bots vollmüllen, aber das ist dann 763 00:59:00,890 --> 00:59:05,670 eigentlich mehr ein Spam oder um den Diskurs zu stören, aber nicht wirklich 764 00:59:05,670 --> 00:59:13,380 einen Einfluss zu haben dabei. Zu den Journalisten, ich kenne da einige 765 00:59:13,380 --> 00:59:20,140 Journalisten, die auf Twitter aktiv sind und dann immer wieder mit einer großen 766 00:59:20,140 --> 00:59:24,049 Anzahl Accounts konfrontiert werden. Ich bin mir da auch nicht sicher, 767 00:59:24,049 --> 00:59:27,488 ob es tatsächlich sich um Botnetzwerke handelt, denn es sind immer wieder 768 00:59:27,488 --> 00:59:31,209 vereinzelt Leute die unterschiedliche Tweets machen, es ist ja schon wahnsinnig 769 00:59:31,209 --> 00:59:35,429 schwierig 100.000 künstliche Tweets zu erzeugen mit einer künstlichen Intelligenz 770 00:59:35,429 --> 00:59:39,019 zu erzeugen, die aber unterschiedlich sind. Das ist schon ein relativ hartes 771 00:59:39,019 --> 00:59:42,589 Problem, ich weiß nicht ob das bereits gelöst ist, ich glaube nämlich nicht. 772 00:59:42,589 --> 00:59:48,469 H: Nummer 4 bitte. M4: Eine Frage zu einem Kriterium, bei dem 773 00:59:48,469 --> 00:59:52,720 ich nicht weiß, ob es aufgetaucht ist oder nicht, oder ob ich nur nicht aufmerksam 774 00:59:52,720 --> 00:59:58,400 genug war. Und zwar geht es um gleichlautende Nachrichten in Tweets zum 775 00:59:58,400 --> 01:00:03,819 Beispiel. Also ich weiß, dass bei Fakenews teilweise ganze absatzweise Texte 1 zu 1 776 01:00:03,819 --> 01:00:10,189 kopiert werden und auch manuell sozusagen, trotzdem kommt mir das auch als ein 777 01:00:10,189 --> 01:00:14,709 wichtiges Kriterium vor um, wie gesagt, einen Einflussfaktor, ist es ein Bot oder 778 01:00:14,709 --> 01:00:19,920 nicht festzustellen. Spielt das in den Studien irgend eine Rolle, die Du 779 01:00:19,920 --> 01:00:24,849 untersucht hast oder für Deine Arbeit? MK: In den Studien kann ich es nicht 780 01:00:24,849 --> 01:00:29,250 sagen, die hatten jetzt immer nur ihre Kriterien mit den Hashtags und so weiter. 781 01:00:29,250 --> 01:00:35,550 Was in meiner Arbeit aufgefallen ist, dass ist immer wieder, zum einen es gibt 782 01:00:35,550 --> 01:00:39,379 natürlich Leute die sagen, ich will das jetzt nicht retweeten sondern ich kopiere 783 01:00:39,379 --> 01:00:43,189 den Tweet und sage sozusagen, dass das mein Eigener ist. Aber es gibt tatsächlich 784 01:00:43,189 --> 01:00:48,220 bestimmte Formulierungen die zu 10.000-en identisch auftauchen, aber es 785 01:00:48,220 --> 01:00:53,429 sind tatsächlich nur Textdatenbanken, die da einfach abgespielt werden, auch nicht 786 01:00:53,429 --> 01:00:57,210 mit politischen Inhalten, sondern ... ich weiß nicht vielleicht sind die dormant 787 01:00:57,210 --> 01:01:01,680 oder sowas, aber keinerlei politische Aktivität zu sehen dort. 788 01:01:01,680 --> 01:01:04,869 H: Und die 2 bitte. * Lachen * 789 01:01:04,869 --> 01:01:12,109 M2: Ja hallo, auch nochmal vielen Dank für den Vortrag. Eine Frage zu dem Thema 790 01:01:12,109 --> 01:01:20,149 Schweden-Reisewarnung, was am Anfang kam. Wie viel Handarbeit war dabei die Tweets 791 01:01:20,149 --> 01:01:23,770 quasi rauszufinden, die zu dieser Story gehören, und wie kannst Du Dir sicher 792 01:01:23,770 --> 01:01:27,269 sein, dass Du alle gefunden hast? MK: Ich kann mir nicht sicher sein, dass 793 01:01:27,269 --> 01:01:31,131 ich alle gefunden habe, insbesondere weil immer wieder Tweets gelöscht werden oder 794 01:01:31,131 --> 01:01:34,889 ganze Accounts. Das hat man auch gesehen, wenn man sich die Daten mal ein halbes 795 01:01:34,889 --> 01:01:38,648 Jahr später anschaut, oder wie viele Accounts in der Zwischenzeit weg sind. Ich 796 01:01:38,648 --> 01:01:41,990 kann mir nicht sicher sein, dass ich alle Tweets gefunden habe, natürlich nicht. Was 797 01:01:41,990 --> 01:01:44,840 man halt machen kann ist sich durchzuhangeln. Man fängt dann an mit 798 01:01:44,840 --> 01:01:48,789 sowas wie "Schweden Reisewarnung" und dann sieht man die ersten, und dann kommen da 799 01:01:48,789 --> 01:01:52,600 aber auch noch andere Begriffe zusammen und hier finde ich nochmal einen Link auf 800 01:01:52,600 --> 01:01:55,579 einen Blogpost und dann suche ich mal nach dem und so weiter, und so wird die 801 01:01:55,579 --> 01:01:59,759 Datenbank immer größer und so habe ich glaube ich 1800 Tweets oder sowas gefunden 802 01:01:59,759 --> 01:02:03,469 und versuch die dann so halbautomatisiert zu kategorisieren mit Fakenews und so 803 01:02:03,469 --> 01:02:07,249 weiter. Das ist sozusagen die Methodik, das ist eigentlich so halbautomatisierte 804 01:02:07,249 --> 01:02:10,119 Handarbeit. H: Jetzt aber, Fefe. 805 01:02:10,119 --> 01:02:14,239 Frage M1 [???]: Ich hab eine H: Die eins ist das bitte. 806 01:02:14,239 --> 01:02:19,159 Frage M1: Hallo, hallo. Also ich hab eine kurze Frage und eine Bitte um weitere 807 01:02:19,159 --> 01:02:22,490 Daten. Erstens würde ich gerne wissen, wie viele von Deinen Rohdaten Du 808 01:02:22,490 --> 01:02:26,760 veröffentlichen kannst und tust. Und zweitens Dein Beispiel am Anfang mit der 809 01:02:26,760 --> 01:02:31,309 Twitter-Timeline da ging's irgendwie um 2.000 Tweets oder 2.000 Leute und das ist 810 01:02:31,309 --> 01:02:35,219 eine Größenordnung, die man häufiger sieht in diesen Debatten und da frage ich mich 811 01:02:35,219 --> 01:02:39,230 immer, ich hab mehr ungelesene Mails in meiner Inbox, wieso interessieren mich 812 01:02:39,230 --> 01:02:43,749 2000 Leute? Ist das irgendwie, wieso ist das jetzt eine relevante Größenordnung? 813 01:02:43,749 --> 01:02:46,799 Kannst du da vielleicht noch etwas dazu sagen? 814 01:02:46,799 --> 01:02:50,739 A: Okay, also das erste war, ob ich meine Daten veröffentlichen kann. Es gibt 815 01:02:50,739 --> 01:02:54,529 tatsächlich eine Guideline von Twitter, die es mir nicht erlaubt beispielsweise 816 01:02:54,529 --> 01:02:58,389 von einem bestimmten Account zehntausende von Tweets zu veröffentlichen. Es gibt 817 01:02:58,389 --> 01:03:02,209 bestimmte Sachen, die man machen darf. Da würde ich mich halt, sonst hätte ich es 818 01:03:02,209 --> 01:03:06,119 jetzt einfach mal so "Rechtsklick veröffentlichen" gemacht. Ich würde es mir 819 01:03:06,119 --> 01:03:11,089 jetzt mal nochmal genauer anschauen, was ich machen darf und so weiter. Gerade 820 01:03:11,089 --> 01:03:14,630 "hydrated Tweets" heißt das, also sozusagen nicht nur Twitter-IDs zu haben, 821 01:03:14,630 --> 01:03:17,469 sondern wirklich eine große csv-Datei oder sowas, die man dann sich in Excel mal 822 01:03:17,469 --> 01:03:20,930 durchklicken kann, kann glaube ich bei dem ein oder anderen, der da frisch mit dem 823 01:03:20,930 --> 01:03:25,339 Thema ist schon weiterhelfen. Muss ich halt mal kucken in den nächsten Tagen. Und 824 01:03:25,339 --> 01:03:29,329 die zweite Frage war, inwieweit zweitausend Accounts einen Einfluss haben? 825 01:03:29,329 --> 01:03:33,150 F: Genau, vielleicht ein bisschen Kontext geben. Ist das irgendwie besonders viel 826 01:03:33,150 --> 01:03:37,439 oder ist das üblich oder findest du das eine relavante Größe? Wieso müssen wir 827 01:03:37,439 --> 01:03:41,029 über 2.000 reden, weil mir kommt es intuitiv nicht so viel vor, frage ich 828 01:03:41,029 --> 01:03:44,299 mich. Bei 80 Millionen Leuten sind 2.000 Leute nicht so. 829 01:03:44,299 --> 01:03:48,620 A: Das ist halt auch ein klassisches wichtiges Argument. Ich meine, erstens es 830 01:03:48,620 --> 01:03:51,920 sind nicht alle Leute in sozialen Netzwerken, dann sind eine Menge Leute in 831 01:03:51,920 --> 01:03:55,829 Facebook. Es ist nur ein winzig kleiner Teil davon auf Twitter und inwieweit da 832 01:03:55,829 --> 01:04:00,150 dann irgendwie 2.000 Leute tatsächlich einen Impact haben auf einen politischen 833 01:04:00,150 --> 01:04:04,819 Diskurs in Deutschand, da wird dann immer gesagt: ja aber in den sozialen Netzwerken 834 01:04:04,819 --> 01:04:09,500 sind aber die Aktivisten, die Journalisten usw. und wenn die beeinflusst werden, 835 01:04:09,500 --> 01:04:16,230 irgendwie sowas. Tatsächlich halte ich die Twitter-Diskussion nicht für politisch, 836 01:04:16,230 --> 01:04:18,679 gesellschaftlich relevant in Deutschland. F: *Lachen* 837 01:04:18,679 --> 01:04:21,069 H: So, eine Frage schaffen wir noch. Das ist die 4. 838 01:04:21,069 --> 01:04:30,269 Frage M4: Hallo! Erst kurz Danke, weil Dein Projekt mir im Studium, mich ziemlich 839 01:04:30,269 --> 01:04:40,269 gerettet hat, also Danke. Und dann ist mir halt aufgefallen, gerade bei diesen Troll- 840 01:04:40,269 --> 01:04:46,959 Armeen, keine Ahnung, diese bezahlten, ob Du mal gekuckt hast in den Accounts, wie 841 01:04:46,959 --> 01:04:52,509 oft sich besitmmte Sachen wiederholen? Zum Beispiel haben die ja oft dasselbe 842 01:04:52,509 --> 01:04:58,729 Profilbild und dann Accounts mit fortlaufenden Nummern, wenn der erste 843 01:04:58,729 --> 01:05:02,629 gelöscht wird oder gesperrt? A: Dieses Phänomen sieht man auch 844 01:05:02,629 --> 01:05:06,469 generell. Das sieht man auch bei wütenden Bürgern, die in den sozialen Netzwerken 845 01:05:06,469 --> 01:05:10,199 sind. Dann von beispielsweise Twitter gesperrt werden, dann wieder rauf kommen 846 01:05:10,199 --> 01:05:13,789 und dann packen sie sich hinter ihren alten Usernamen einfach noch eine Zahl 847 01:05:13,789 --> 01:05:17,739 hinten dran. Aber ob die Leute tatsächlich bezahlt werden oder nicht, das kriege ich 848 01:05:17,739 --> 01:05:21,510 über eine Twitter-API auch nicht heraus. Eigentlich müsste man dann fast wie ein 849 01:05:21,510 --> 01:05:26,059 Ethnologe sich mit den Leuten unterhalten und kucken, was sie da für eine Agenda 850 01:05:26,059 --> 01:05:31,660 haben. Ich finde es aber gefährlich dann von vornherein zu sagen, die sind bezaht 851 01:05:31,660 --> 01:05:35,729 oder sind vom Kreml gesteuert oder sind künstliche Intelligenzen oder keine Ahnung 852 01:05:35,729 --> 01:05:39,459 was. Das muss auf jeden Fall wieder eine Debatte sein, die auf evidenzbasierter 853 01:05:39,459 --> 01:05:42,323 Forschung basiert. F: Ja ich hab die auch nur. Bin ich noch 854 01:05:42,323 --> 01:05:44,150 da? H: Ja. 855 01:05:44,150 --> 01:05:52,219 F: Ich hab die auch nur zufällig gefunden, weil ich das halt gemacht hab damals zur 856 01:05:52,219 --> 01:05:58,920 Türkei-Wahl und es halt sehr viele Accounts gab, die immer so türkischen Spam 857 01:05:58,920 --> 01:06:03,309 gepostet haben, sich dann aber plötzlich in sehr schlechtem Deutsch in deutsche 858 01:06:03,309 --> 01:06:06,600 Debatten eingemischt hatten. A: Super, dann sollten wir auf jeden Fall 859 01:06:06,600 --> 01:06:09,679 mal unterhalten, ich glaube da können wir uns gegenseitig helfen. 860 01:06:09,679 --> 01:06:13,440 H: Unterhalten könnt ihr euch gleich neben der Bühne, die Zeit ist nämlich jetzt 861 01:06:13,440 --> 01:06:17,563 leider um. Vielen Dank Michael Kreil! Da geht mehr! 862 01:06:17,563 --> 01:06:25,709 *Applaus* 863 01:06:25,709 --> 01:06:30,999 *Abspannmusik* 864 01:06:30,999 --> 01:06:42,769 Untertitel erstellt von c3subtitles.de im Jahr 2019. Mach mit und hilf uns!