1
00:00:15,719 --> 00:00:21,530
Herald-Angel: Der nächste Vortrag ist
„Beeinflussung durch Künstliche

2
00:00:21,530 --> 00:00:27,170
Intelligenz". Es ist ein
Einführungsvortrag, also einer der

3
00:00:27,170 --> 00:00:31,580
explizit dazu gedacht ist, dass ihr das
ohne Vorkenntnisse versteht. Und es geht

4
00:00:31,580 --> 00:00:41,159
ums Maschinelle Lernen. Unsere Sprecher
sind die Karen – sie forscht in Amsterdam

5
00:00:41,159 --> 00:00:47,729
an Maschinellem Lernen, kommt ursprünglich
aus Leipzig – und der Hendrik Heuer, der

6
00:00:47,729 --> 00:00:55,440
in Bremen an Mensch-Computer-Interaktion
forscht. Großes Willkommen für die beiden!

7
00:00:55,440 --> 00:01:03,190
*Applaus*

8
00:01:03,190 --> 00:01:06,930
Hendrik Heuer: Vielen Dank! Moin erstmal!
Willkommen zu unserem Vortrag

9
00:01:06,930 --> 00:01:10,909
„Beeinflussung durch Künstliche
Intelligenz" über die Banalität der

10
00:01:10,909 --> 00:01:14,920
Beeinflussung und das Leben mit
Algorithmen. Wir würden gern mit einem

11
00:01:14,920 --> 00:01:19,979
Zitat von Kate Crawford beginnen. Kate
Crawford ist die Gründerin des AI Now

12
00:01:19,979 --> 00:01:23,841
Institut das die sozialen Auswirkungen von
künstlicher Intelligenz untersucht. Sie

13
00:01:23,841 --> 00:01:28,090
ist außerdem ein Principal Researcher bei
Microsoft Research und Professorin an der

14
00:01:28,090 --> 00:01:33,840
New York University. Und die hat beim AI
Now Symposium in diesem Jahr gesagt: „Die

15
00:01:33,840 --> 00:01:37,170
Menschen befürchten, dass Computer zu
intelligent werden und die Welt erobern.

16
00:01:37,170 --> 00:01:42,549
Aber Computer sind zu dumm und haben die
Welt bereits erobert." Wir teilen diese

17
00:01:42,549 --> 00:01:47,420
Ansicht. Es gibt keine digitale Welt. Die
Welt ist digital, das heißt durch digitale

18
00:01:47,420 --> 00:01:51,799
Medien konstruiert. Und uns war es ein
Anliegen, einige englischsprachige

19
00:01:51,799 --> 00:01:55,659
Diskussion jetzt nochmal auf Deutsch
zusammenzuführen. Es können also Beispiele

20
00:01:55,659 --> 00:02:00,700
kommen die der eine oder andere vielleicht
schon kennt. Aber wir führen sie hier

21
00:02:00,700 --> 00:02:05,390
nochmal zusammen und versuchen sie zu
kontextualisieren. Warum Banalität der

22
00:02:05,390 --> 00:02:09,880
Überwachung? Banalität, weil die Systeme
des maschinellen Lernens im Kern sehr

23
00:02:09,880 --> 00:02:14,520
simpel sind, weil aber auch die
Beeinflussung sehr subtil sein kann und

24
00:02:14,520 --> 00:02:17,080
das Ganze ist auch eine Reminiszenz an
Hannah Arendt.

25
00:02:17,080 --> 00:02:21,330
Noch mal kurz zu uns. Wie gesagt: Ich
werde die ersten 20 Minuten sprechen über

26
00:02:21,330 --> 00:02:25,280
die Mensch-Computer-Interaktions-
Perspektive, Karen Ullrich wird die zweite

27
00:02:25,280 --> 00:02:29,170
Hälfte bestreiten. Karen ist
wissenschaftliche Mitarbeiterin in

28
00:02:29,170 --> 00:02:33,920
Amsterdam, im Amsterdam Machine Learning
Lab, und sie forscht direkt zu den

29
00:02:33,920 --> 00:02:37,660
Algorithmen des maschinellen Lernens,
insbesondere Bayesian methods, also ein

30
00:02:37,660 --> 00:02:41,950
Hintergrund im Deep Learning und der
Informationstheorie. Ich bin

31
00:02:41,950 --> 00:02:46,470
wissenschaftlicher Mitarbeiter im Institut
für Informationsmanagement Bremen und mir

32
00:02:46,470 --> 00:02:50,000
geht es um die Nutzererfahrung von
Maschine Learning, insbesondere das

33
00:02:50,000 --> 00:02:56,380
Vertrauen. Wir würden jetzt gerne anfangen
mit einem Beispiel, das jeder kennt: Spam-

34
00:02:56,380 --> 00:02:59,990
Erkennung. Benutzt wahrscheinlich jeder
hier. Funktioniert auch nicht immer. Aber

35
00:02:59,990 --> 00:03:03,090
man muss sich wirklich vor Augen führen,
dass es eine beeindruckende technische

36
00:03:03,090 --> 00:03:07,100
Leistung ist, auch wenn es manchmal nicht
funktioniert. Und wir nehmen es hier, um

37
00:03:07,100 --> 00:03:11,620
den Unterschied zwischen imperativer
Programmierung und maschinellem Lernen zu

38
00:03:11,620 --> 00:03:16,540
verdeutlichen. Imperative Programmierung
ist das, woran wahrscheinlich jeder denkt,

39
00:03:16,540 --> 00:03:18,480
wenn er an Informatik und Programmierung
denkt.

40
00:03:18,480 --> 00:03:21,940
Es geht um Regeln und Anweisungen: Wenn X

41
00:03:21,940 --> 00:03:26,430
dann Y. Das Wort Imperativ für Befehl
steckt ja auch schon im Namen. Und wenn

42
00:03:26,430 --> 00:03:30,210
wir jetzt Spam imperativ erkennen wollen
würden, dann würde man zum Beispiel

43
00:03:30,210 --> 00:03:34,140
gucken, Okay das Wort Viagra wird so
geschrieben in der Nachricht vorkommen,

44
00:03:34,140 --> 00:03:39,210
dann ist es eine Spam-Nachricht.
Andererseits ist es eine gutartige

45
00:03:39,210 --> 00:03:43,710
Nachricht. Maschinelles Lernen ist jetzt
ein komplett anderer Ansatz. Da hat man

46
00:03:43,710 --> 00:03:49,040
eine Vorhersage die man iterativ, also
immer und immer wieder, verbessert. Für

47
00:03:49,040 --> 00:03:53,000
die Spam-Klassifikation versucht man zum
Beispiel Kombinationen von Wörtern zu

48
00:03:53,000 --> 00:03:56,900
finden, durch die es wahrscheinlich wird,
dass es sich um Spam handelt.

49
00:03:56,900 --> 00:04:02,160
Der Kernbegriff ist hier also wahrscheinlich. Und
das sieht dann so aus, dass man für viele

50
00:04:02,160 --> 00:04:07,400
verschiedene Beispiele prognostiziert, ob
eine Nachricht Spam ist oder nicht. Dann

51
00:04:07,400 --> 00:04:12,010
berechnet man Fehler mit einer geeigneten
Fehlerfunktion und dann ändert man seine

52
00:04:12,010 --> 00:04:16,721
Parameter, um den Fehler zu verringern und
geht wieder zum ersten Schritt und macht

53
00:04:16,721 --> 00:04:21,589
das immer und immer wieder. Natürlich ist
es nicht ganz so einfach, diesen Fehler zu

54
00:04:21,589 --> 00:04:24,630
berechnen, und auch die Parameter zu
verändern, ist ein eigenes

55
00:04:24,630 --> 00:04:28,030
Forschungsgebiet. Aber im Kern ist es
wirklich so simpel wie wir es hier

56
00:04:28,030 --> 00:04:33,081
darstellen. Und deswegen ist es spannend
im Hinterkopf zu behalten. Dabei ist es

57
00:04:33,081 --> 00:04:36,720
aber spannend im Hinterkopf zu behalten,
dass Spam-Erkennen nicht mit

58
00:04:36,720 --> 00:04:40,790
Textverständnis gleichzusetzen ist. Das
heißt der Algorithmus muss nicht erst

59
00:04:40,790 --> 00:04:45,030
Kafka verstehen können, um zu erkennen, ob
etwas Spam ist oder nicht. Und dieses

60
00:04:45,030 --> 00:04:48,960
Problem, dass etwas wirkungsvoller
aussieht als es vermeintlich ist, wird uns

61
00:04:48,960 --> 00:04:54,840
im Laufe des Vortrags noch begegnen.
Wir haben jetzt ein weiteres, immer noch

62
00:04:54,840 --> 00:04:58,700
vereinfachtes Beispiel für eine
Entscheidungshilfe, hier aus der Medizin.

63
00:04:58,700 --> 00:05:03,960
Das Ziel ist hier die Erkennung von
Brustkrebs. Statt Wörtern wie beim Spam

64
00:05:03,960 --> 00:05:09,660
haben wir verschiedene Features, das heißt
Charakteristika, an denen man zum Beispiel

65
00:05:09,660 --> 00:05:14,760
gutartigen von bösartigem Brustkrebs
unterscheiden kann. Dazu gehören hier der

66
00:05:14,760 --> 00:05:20,850
Radius, die Textur, Umfang, Fläche, Glätte
aber auch so Sachen wie die Symmetrie und

67
00:05:20,850 --> 00:05:25,780
die Zahl konkaver Punkte, also nach innen
gewölbter Punkte, das seht ihr hier oben.

68
00:05:25,780 --> 00:05:30,610
Insgesamt gibt es in diesem vereinfachten
Datensatz 32 verschiedene Charakteristika.

69
00:05:30,610 --> 00:05:36,260
Und wenn wir jetzt zwei Charakteristika
wie z.B. die durchschnittliche Zahl der

70
00:05:36,260 --> 00:05:41,190
konkaven Punkte und die durchschnittliche
Fläche in Pixeln anschauen und abtragen,

71
00:05:41,190 --> 00:05:45,450
dann erkennt man eine deutliche Tendenz:
Ab einem bestimmten Punkt – ab einer

72
00:05:45,450 --> 00:05:48,520
bestimmten Zahl Punkte und ab einer
bestimmten Fläche – sehen wir nur noch

73
00:05:48,520 --> 00:05:54,000
bösartigen Brustkrebs. Das heißt
mathematisch können wir im Beispiel

74
00:05:54,000 --> 00:05:58,091
einfach eine Linie durch diesen Datensatz
ziehen und das ist eine sogenannte

75
00:05:58,091 --> 00:06:02,169
Entscheidungsgrenze, die Decision-
Boundary. Die Entscheidungsgrenze muss

76
00:06:02,169 --> 00:06:05,000
nicht linear sein, es muss nicht eine
einfache Linie sein.

77
00:06:05,000 --> 00:06:10,140
Die kann durchaus komplexer sein und in
der Regel ist sie das. Und dieser Ansatz

78
00:06:10,140 --> 00:06:14,650
ist durchaus analog zu dem, was eine
erfahrene Ärztin oder ein erfahrener Arzt

79
00:06:14,650 --> 00:06:18,531
mehr oder weniger bewusst machen würde.
Die haben auch aus Erfahrung gelernt: ab

80
00:06:18,531 --> 00:06:23,800
der Größe, und ab der Fläche und der Zahl
ist es wahrscheinlich bösartig oder

81
00:06:23,800 --> 00:06:27,480
gutartig. Der Clou am Maschinellen Lernen
ist jetzt, dass wir das für viele

82
00:06:27,480 --> 00:06:31,620
verschiedene Charakteristika gleichzeitig
machen können. Und darüber hinaus

83
00:06:31,620 --> 00:06:36,060
profitieren wir sehr stark davon, wenn wir
mehr Daten haben, weil wir dadurch bessere

84
00:06:36,060 --> 00:06:38,560
Entscheidungen treffen können. Weil wir
eine bessere Entscheidungsgrenze finden.

85
00:06:38,560 --> 00:06:45,340
Ihr seht aber auch, dass eine gute Zahl an
roten und blauen Punkten im Beispiel auf

86
00:06:45,340 --> 00:06:49,871
der falschen Seite der Grenze liegen.
Das heißt dort machen wir Fehler und da

87
00:06:49,871 --> 00:06:53,300
muss man im Hinterkopf behalten, dass es
verschiedene Arten von Fehlern gibt und

88
00:06:53,300 --> 00:06:57,010
die auch verschiedene Auswirkungen haben.
Falls ich zum Beispiel jemandem mit

89
00:06:57,010 --> 00:07:02,669
gutartigen Brustkrebs fälschlicherweise
sage, dass ihr Brustkrebs bösartig ist,

90
00:07:02,669 --> 00:07:07,870
löst das sicherlich Stress aus und ist
keine angenehme Situation. Falls ich aber

91
00:07:07,870 --> 00:07:11,560
jemanden mit bösartigem Brustkrebs
fälschlicherweise sage, dass ihr

92
00:07:11,560 --> 00:07:15,130
Brustkrebs gutartig ist und sie auch
entsprechend behandle, kann das deutlich

93
00:07:15,130 --> 00:07:19,900
schlimmere Konsequenzen haben. Das ist
jetzt natürlich ein vereinfachtes

94
00:07:19,900 --> 00:07:24,900
Beispiel. Aber gleichzeitig werden wir
zeigen, dass ähnliche Entscheidungshilfen

95
00:07:24,900 --> 00:07:29,210
durchaus in sehr kritischen Bereichen
genutzt werden. Vorher wollen wir noch

96
00:07:29,210 --> 00:07:33,750
einmal die Wirkungsmacht von Big Data
zeigen und da geht es darum,

97
00:07:33,750 --> 00:07:39,800
Persönlichkeitsmerkmale zu erkennen. Das
heißt hier nimmt man digitale Spuren wie

98
00:07:39,800 --> 00:07:43,960
Facebook-Likes, die relativ einfach
zugänglich sind, es aber ermöglichen,

99
00:07:43,960 --> 00:07:47,460
hochgradig sensible
Persönlichkeitsmerkmale vorherzusagen.

100
00:07:47,460 --> 00:07:54,380
Das ist ein Paper von 2013 und für die
Studie haben sie 58.000 Freiwillige in den

101
00:07:54,380 --> 00:07:58,060
USA gefunden, die eine Facebook-App
benutzt haben. Und die haben dieser

102
00:07:58,060 --> 00:08:02,120
Facebook-App ihr komplettes Profil zur
Verfügung gestellt mit allen Likes aber

103
00:08:02,120 --> 00:08:06,060
auch mit allen Informationen wie zum
Beispiel der sexuellen Orientierung oder

104
00:08:06,060 --> 00:08:10,540
der religiösen Zugehörigkeit. Was jetzt
gemacht wurde ist mit einem sehr einfachen

105
00:08:10,540 --> 00:08:16,700
Modell, mit einem einfachen Regressions-
Modell, vorhergesagt, von welchen Likes,

106
00:08:16,700 --> 00:08:21,270
ob man anhand der Likes bestimmte
Persönlichkeitsmerkmale erkennen kann. Und

107
00:08:21,270 --> 00:08:26,570
es zeigt sich, dass man zum Beispiel mit
95-prozentiger Genauigkeit erkennen kann,

108
00:08:26,570 --> 00:08:32,620
ob jemand weiß oder afroamerikanisch ist.
Sexuelle Orientierung kann man auch mit

109
00:08:32,620 --> 00:08:38,999
sehr hoher Genauigkeit nur anhand der
Likes erkennen, das Geschlecht, die

110
00:08:38,999 --> 00:08:44,350
politische Orientierung, die religiöse
Zugehörigkeit, aber auch so Sachen wie die

111
00:08:44,350 --> 00:08:49,100
Drogenerfahrung und der Familienstand der
Eltern in der Kindheit.

112
00:08:49,100 --> 00:08:53,970
Und ihr seht schon bei der religiösen
Zugehörigkeit sind wir bei 82 Prozent

113
00:08:53,970 --> 00:08:58,589
Genauigkeit, bei so etwas wie
Drogenerfahrung und der Ehe ist es relativ

114
00:08:58,589 --> 00:09:03,579
wenig mit der Genauigkeit: Es ist eine
50/50 Chance, wenn wir raten würden.

115
00:09:03,579 --> 00:09:09,389
Aber es ist trotzdem eine Indikation. Und
wir zeigen das auch nur, weil das

116
00:09:09,389 --> 00:09:12,992
wahnsinnige Möglichkeiten der
Diskriminierung bildet. Und das passiert

117
00:09:12,992 --> 00:09:17,661
auch auf dem Wohnungsmarkt oder auf dem
Arbeitsmarkt. Das heißt was wir hier

118
00:09:17,661 --> 00:09:21,089
zeigen wollen, ist, dass wir unsere
Vorstellungen von Datenschutz überdenken

119
00:09:21,089 --> 00:09:26,019
und ausweiten müssen, weil man halt auch
Persönlichkeitsmerkmale inferieren können

120
00:09:26,019 --> 00:09:31,630
kann. Denn man kann mit solchen Modellen
auch die Likes finden, die am

121
00:09:31,630 --> 00:09:36,050
aussagekräftigsten für ein bestimmtes
Charakteristikum sind. Das heißt wir haben

122
00:09:36,050 --> 00:09:41,170
hier drei Likes: einmal die Marke Harley-
Davidson, Kringel-Pommes/curly fries und

123
00:09:41,170 --> 00:09:45,019
das Musical Wicked. Und ich überlasse es
euch mal, herauszufinden, welches Bild mit

124
00:09:45,019 --> 00:09:49,790
niedriger Intelligenz, hoher Intelligenz
und Homosexualität bei Männern verbunden

125
00:09:49,790 --> 00:09:56,439
ist. Diese durchaus fragwürdige
Forschungsrichtung nennt sich Psychometrik

126
00:09:56,439 --> 00:10:00,860
oder auch Psychografie. Und das Spannende
ist, dass sie ja relativ nah dran ist am

127
00:10:00,860 --> 00:10:04,009
Kern-Versprechen von so Unternehmen wie
Google und Facebook.

128
00:10:04,009 --> 00:10:08,740
Denn die versprechen ihren Kunden – ihren
Werbekunden – wir finden für euch

129
00:10:08,740 --> 00:10:13,149
Leute, die sich für Dienst X oder Produkt
Y interessieren könnten. Und hier haben

130
00:10:13,149 --> 00:10:18,279
wir jetzt das Element der Beeinflussung.
Beeinflussung heißt hier, Big Data zu

131
00:10:18,279 --> 00:10:23,230
nutzen, um Leute zu finden, und die
Beeinflussung ist noch sehr banal. Aber

132
00:10:23,230 --> 00:10:26,810
solche Forschung kann natürlich auch
genutzt werden, um zum Beispiel in einer

133
00:10:26,810 --> 00:10:31,059
großen Menge von Wählerinnen jene zu
finden, die noch überzeugt werden könnten.

134
00:10:31,059 --> 00:10:34,771
Und ihr habt – viele von euch haben
wahrscheinlich den Artikel in das Magazin

135
00:10:34,771 --> 00:10:39,199
gelesen, wo kolportiert wurde, dass diese Art
von Psychografie für Trump und Brexit

136
00:10:39,199 --> 00:10:43,079
verantwortlich ist. Vor der Bundestagswahl
gab es ja auch eine große Diskussion, dass

137
00:10:43,079 --> 00:10:47,689
das hier passieren könnte. Wir glauben,
dass das mit Vorsicht zu genießen ist,

138
00:10:47,689 --> 00:10:51,160
aber die Möglichkeit mit derartigen
Ansätzen überzeugbare Wählerinnen und Wähler

139
00:10:51,160 --> 00:10:53,790
zu finden und anzusprechen, ist durchaus
realistisch.

140
00:10:53,790 --> 00:11:00,990
Und wir haben schon gesehen, dass es
dadurch so eine Art Diskriminierung 2.0

141
00:11:00,990 --> 00:11:05,312
gibt. Denn ein homophober Arbeitgeber muss
nicht mehr direkt erfragen, ob jemand

142
00:11:05,312 --> 00:11:09,610
homosexuell ist, wenn er es aus einem
Facebook-Profil vorhersagen kann, und es

143
00:11:09,610 --> 00:11:13,129
interessiert ihn vielleicht auch nicht, ob
er da einen Fehler macht und einen

144
00:11:13,129 --> 00:11:18,209
Heterosexuellen möglicherweise falsch
einordnet. Diese Beeinflussung kann aber

145
00:11:18,209 --> 00:11:23,689
durchaus direkter sein. In den USA werden
Algorithmen jetzt schon im Justizsystem

146
00:11:23,689 --> 00:11:28,300
als Entscheidungshilfe eingesetzt, und da
wird zum Beispiel mit bestimmten

147
00:11:28,300 --> 00:11:32,639
Informationen über die Leute vorhergesagt,
ob jemand rückfällig wird, der im

148
00:11:32,639 --> 00:11:37,759
Gefängnis ist, oder nicht. Das heißt man
versucht vorherzusagen auf einer Skala von

149
00:11:37,759 --> 00:11:43,590
1 für ungefährlich bis 10 für hochgradig
gefährlich, wo jemand hinkommt. Und hier

150
00:11:43,590 --> 00:11:49,069
haben wir zwei Beispiele: Einmal den Herrn
links – VP die Initialen –, der zwei

151
00:11:49,069 --> 00:11:53,980
bewaffnete Raubüberfälle begangen und
einen versuchten bewaffneten Raubüberfall,

152
00:11:53,980 --> 00:11:58,519
und die Risikoeinschätzung ist hier 3
niedriges Risiko.

153
00:11:58,519 --> 00:12:03,730
Daneben steht die Dame – BB –, die hat
vier Ordnungswidrigkeiten unter

154
00:12:03,730 --> 00:12:11,509
Jugendstrafrecht auf dem Kerbholz, und die
wird eingestuft mit hohes Risiko. Und wie

155
00:12:11,509 --> 00:12:15,199
sieht das jetzt aus. Also die Leute von
ProPublica die das recherchiert haben,

156
00:12:15,199 --> 00:12:20,600
haben jetzt über zwei Jahre geguckt, wer
wirklich rückfällig wird und wer nicht. BB

157
00:12:20,600 --> 00:12:24,689
– die Dame rechts –, die begeht keine
weiteren Verbrechen. VP – der Herr links

158
00:12:24,689 --> 00:12:27,870
–, der begeht nach seiner Freilassung
direkt einen schweren Diebstahl. Das

159
00:12:27,870 --> 00:12:31,269
Besondere ist hier, und ihr werdet es
wahrscheinlich schon geraten haben, ist,

160
00:12:31,269 --> 00:12:35,900
dass der Algorithmus systematisch
Afroamerikanerinnen diskriminiert. Es gibt

161
00:12:35,900 --> 00:12:41,250
also ein Bias, eine Verzerrung, gegen
Schwarze. Darüber hinaus sind diese

162
00:12:41,250 --> 00:12:46,059
Vorhersagen von den proprietären Kompass-
Systemen nur in 61 Prozent derzeit

163
00:12:46,059 --> 00:12:51,209
richtig. Wenn man jetzt die wirkliche
Rückfälligkeit über zwei Jahren nimmt. Und

164
00:12:51,209 --> 00:12:55,089
wir kennen das aus der Statistik: Dort
unterscheiden wir den Fehler erster Art

165
00:12:55,089 --> 00:12:59,149
und den Fehler zweiter Art. Das heißt
unsere Nullhypothese ist: Der oder die

166
00:12:59,149 --> 00:13:03,689
Straftäterin wird nicht rückfällig.
Der Fehler erster Art ist jetzt, dass die,

167
00:13:03,689 --> 00:13:08,739
die mit hohem Risiko eingestuft werden,
aber nicht rückfällig werden. Und da sehen

168
00:13:08,739 --> 00:13:12,500
wir – oder hat ProPublica herausgefunden
–, dass die Wahrscheinlichkeit, dass ein

169
00:13:12,500 --> 00:13:18,189
Weißer oder eine Weiße Opfer dieses
Fehlers wird, bei 23,5 Prozent liegt und

170
00:13:18,189 --> 00:13:22,199
bei Afroamerikanerinnen liegt die
Wahrscheinlichkeit bei 44,9, also fast

171
00:13:22,199 --> 00:13:25,910
doppelt so hoch. Es gibt auch den Fehler
zweiter Art. Das ist die

172
00:13:25,910 --> 00:13:29,429
Wahrscheinlichkeit,
dass jemand mit niedrigem Risiko

173
00:13:29,429 --> 00:13:33,590
eingestuft wird, aber trotzdem rückfällig
wird. Und hier ist die Wahrscheinlichkeit

174
00:13:33,590 --> 00:13:41,779
umgekehrt: Weiße haben eine 47-Prozent-
Chance diesem Fehler zum Opfer zu fallen.

175
00:13:41,779 --> 00:13:49,549
Afroamerikanerinnen nur 28 Prozent. Aber
wie kommt das? Wir nehmen jetzt mal an,

176
00:13:49,549 --> 00:13:53,290
dass das kompetente Programmiererinnen
sind, die in den Maschine Learning Kursen,

177
00:13:53,290 --> 00:13:56,920
die sie gemacht haben, gut aufgepasst
haben und technisch alles richtig gemacht

178
00:13:56,920 --> 00:13:59,980
haben.
Nun lernt Maschine Learning immer eine

179
00:13:59,980 --> 00:14:05,459
Abbildung von einem X auf ein Y. Z. B.
hier haben wir bestimmte Informationen zu

180
00:14:05,459 --> 00:14:11,089
Gefangenen und diese Rückfälligkeit der
Gefangenen. Das Problem ist jetzt das X

181
00:14:11,089 --> 00:14:15,300
ist keine Stichprobe der Grundgesamtheit,
sondern eine Untermenge der

182
00:14:15,300 --> 00:14:19,179
Grundgesamtheit, die die Polizei
untersucht hat. Es ist also ein X', es ist

183
00:14:19,179 --> 00:14:24,009
nicht repräsentativ. Und das kann eine
selbsterfüllende Prophezeiung sein. Denn

184
00:14:24,009 --> 00:14:27,220
vielleicht sind Afroamerikanerinnen
einfach in der Situation, dass sie

185
00:14:27,220 --> 00:14:31,779
deutlich häufiger kontrolliert werden und
es einfach dadurch mehr Straffälle in

186
00:14:31,779 --> 00:14:36,550
dem Datensatz gibt. Und auf der auch auf
der anderen Seite auf der Y Seite, das

187
00:14:36,550 --> 00:14:40,459
heißt diese Risikobeurteilung, ob man
rückfällig wird oder nicht, ist ebenfalls

188
00:14:40,459 --> 00:14:45,269
eine Verfälschung. Denn die bezieht sich
ja auch nur auf die, die vom Rechtssystem

189
00:14:45,269 --> 00:14:49,899
verurteilt werden.
Das heißt hier haben wir auch ein Y'. Wenn

190
00:14:49,899 --> 00:14:54,089
man zum Beispiel ein Jurysystem hat, wie
man es in den USA findet, dann kann auch

191
00:14:54,089 --> 00:14:58,790
dort latent oder weniger latent
diskriminiert werden. Das macht Maschine

192
00:14:58,790 --> 00:15:04,399
Learning – pseudo-objektive, mathematische
Modelle – zu einer Art Geldwäsche für

193
00:15:04,399 --> 00:15:08,649
Vorurteile. Weil sie fallen in dieses
System rein und sind dann erst einmal

194
00:15:08,649 --> 00:15:14,360
nicht mehr sichtbar. Und hier kommen wir
jetzt zum Element der direkten

195
00:15:14,360 --> 00:15:17,339
Beeinflussung.
Denn diese Systeme werden zwar nur als

196
00:15:17,339 --> 00:15:22,019
Entscheidungshilfen verkauft, es sind halt
nur Werkzeuge, die genutzt werden können,

197
00:15:22,019 --> 00:15:26,350
aber die Leute, die die Entscheidung
treffen, verlassen sich direkt auf diese

198
00:15:26,350 --> 00:15:29,949
Systeme. Das heißt sie vertrauen diesen
diskriminierenden Algorithmen. Das

199
00:15:29,949 --> 00:15:33,429
Beispiel kommt aus dem hervorragenden
Deutschlandfunk-Feature von Thomas

200
00:15:33,429 --> 00:15:39,689
Schimmeck. Und der hat zum Beispiel
Veronika Hiller, die Bewährungshelferin,

201
00:15:39,689 --> 00:15:45,019
die dem Richter im Endeffekt ein Strafmaß
vorschlägt, interviewt. Das Spannende ist,

202
00:15:45,019 --> 00:15:48,189
die hat also ein Vierteljahrhundert
Erfahrung im Dienst. Aber sie schwört auf

203
00:15:48,189 --> 00:15:52,839
diesen Algorithmus. Sie sagt der ist gut,
akkurat und einfach. Was wir einfach

204
00:15:52,839 --> 00:15:57,989
zeigen wollen, ist, dass es hier um sozio-
technische Systeme geht. Das heißt es

205
00:15:57,989 --> 00:16:01,519
geht nicht nur um das Maschine Learning.
Es geht nicht nur um den Algorithmus.

206
00:16:01,519 --> 00:16:05,389
Sondern es geht auch um die Menschen, die
ihn nutzen. Denn selbst wenn das System

207
00:16:05,389 --> 00:16:09,569
fair wäre – wir haben gerade gesehen dass
es das nicht ist –, heißt es immer noch

208
00:16:09,569 --> 00:16:13,910
nicht, dass die Ergebnisse des Systems
auch fair interpretiert werden, und wir

209
00:16:13,910 --> 00:16:17,740
finden das ist sehr wichtig für jene, die
solche Systeme bauen – und da sind

210
00:16:17,740 --> 00:16:22,389
wahrscheinlich einige heute hier. Diese
Verzerrung in und durch Daten sind

211
00:16:22,389 --> 00:16:27,089
allgegenwärtig. Wir haben zum Beispiel
hier ein Beispiel von Google. Das ist eine

212
00:16:27,089 --> 00:16:32,100
Suche nach den Keywords „Three White
Teenagers". Und das ist eine Suche nach

213
00:16:32,100 --> 00:16:38,489
den Keywords „Three Black Teenagers". Das
heißt Technologie offenbart hier

214
00:16:38,489 --> 00:16:41,779
gesellschaftliche Probleme.
Wir haben es wie gesagt mit sozi-

215
00:16:41,779 --> 00:16:46,769
technischen Systemen zu tun, die eine
bestimmte Weltvorstellung festschreiben,

216
00:16:46,769 --> 00:16:51,660
vermitteln, aber auch verstärken können.
Und die Probleme können ganz subtil und

217
00:16:51,660 --> 00:16:55,749
banal sein wie zum Beispiel dieses
Beispiel aus der statistischen Übersetzung

218
00:16:55,749 --> 00:16:59,500
zeigt: Jetzt muss man wissen, dass die
türkische Sprache nicht zwischen

219
00:16:59,500 --> 00:17:04,279
Geschlechtern unterscheidet, das heißt
„er", „sie" und „es" sind alle „o". Es

220
00:17:04,279 --> 00:17:07,669
gibt auch keine Unterscheidung zwischen
„Arzt" und „Ärztin" beides „Doktor". Und

221
00:17:07,669 --> 00:17:11,869
wenn wir jetzt mit Google Translate oder
einem anderen statistischen

222
00:17:11,869 --> 00:17:16,970
Übersetzungsprogramm Sätze wie „Er ist ein
Babysitter." und „Sie ist eine Ärztin."

223
00:17:16,970 --> 00:17:21,449
hin und her übersetzen, dann stellen wir
fest, dass die Übersetzung bestimmte

224
00:17:21,449 --> 00:17:23,140
Geschlechterklischees widerspiegelt.

225
00:17:23,140 --> 00:17:27,659
Und ihr könnt mit dem was ihr bisher über
Machine Learning gelernt habt in diesem

226
00:17:27,659 --> 00:17:32,380
Vortrag vielleicht schon erklären, wie das
passiert. Wir lernen aus Beispielen und in

227
00:17:32,380 --> 00:17:37,520
diesen Beispielen sind Verzerrungen. In
diesem Fall mehr weibliche Babysitter,

228
00:17:37,520 --> 00:17:41,440
mehr männliche Ärzte.
Denn wenn wir übersetzen dann berechnen

229
00:17:41,440 --> 00:17:45,080
wir ja Wahrscheinlichkeiten und nehmen in
der Regel einfach das wahrscheinlichste

230
00:17:45,080 --> 00:17:49,169
Ergebnis. Das heißt selbst minimale
Verzerrungen können verstärkt werden. Das

231
00:17:49,169 --> 00:17:54,539
heißt eine Babysitterin mehr, ein Arzt
mehr und diese Übersetzung sieht so aus,

232
00:17:54,539 --> 00:17:59,299
wie wir sie gerade sehen. Aber hier haben
wir etwas, das technisch erklärbar ist.

233
00:17:59,299 --> 00:18:03,010
Aber welche Auswirkungen hat das auf die
NutzerInnen. Welche Auswirkungen hat das

234
00:18:03,010 --> 00:18:09,450
auf die Weltsicht, wenn man die Google-
Ergebnisse so sieht wie man sie sieht. Und

235
00:18:09,450 --> 00:18:13,760
anhand von Facebook wollen wir jetzt
zeigen, wie direkt und intransparent diese

236
00:18:13,760 --> 00:18:17,730
Beeinflussung sein kann. Auch Facebook ist
ein hochkomplexes sozio-technisches

237
00:18:17,730 --> 00:18:22,760
System, in dem NutzerInnen gleichzeitig
Produzenten und KonsumentInnen sind.

238
00:18:22,760 --> 00:18:28,690
Facebooks erklärtes Ziel lautet ja, jedem
zu jeder Zeit die richtigen Inhalte zu

239
00:18:28,690 --> 00:18:34,250
zeigen. Dafür nutzt Facebook nach eigener
Aussage hundert tausend verschiedene

240
00:18:34,250 --> 00:18:38,440
Faktoren, um algorithmisch die besten
Geschichten aus den potenziellen

241
00:18:38,440 --> 00:18:40,159
Geschichten auszuwählen.

242
00:18:40,159 --> 00:18:44,549
Das heißt, wenn ihr euch jetzt vorstellt -
das sind jetzt Zahlen aus dem Kosinski-

243
00:18:44,549 --> 00:18:50,750
Paper mit den Persönlichkeitsmerkmalen.
Das heißt da haben die Leute im Median 200

244
00:18:50,750 --> 00:18:56,710
Bekannte und liken 68 Seiten. Das heißt
wenn nur jeder Dritte was macht, dann sind

245
00:18:56,710 --> 00:19:00,970
das pro Tag 90 potenzielle Beiträge. Wenn
man jetzt nur fünf oder zehn Minuten auf

246
00:19:00,970 --> 00:19:04,460
der Seite verweilt, dann kann man sich
nicht angucken. Das heißt eine

247
00:19:04,460 --> 00:19:10,130
chronologische Darstellung ist zwecklos
und eine Kuration unumgänglich. Und

248
00:19:10,130 --> 00:19:15,080
deswegen sortiert Facebook die Nachrichten
nach einem Algorithmus. Das Problem ist

249
00:19:15,080 --> 00:19:18,240
aber, dass dieser Vorgang sehr
intransparent ist. Das heißt die

250
00:19:18,240 --> 00:19:19,929
NutzerInnen sehen und verstehen die
Algorithmen nicht

251
00:19:19,929 --> 00:19:25,000
Und die glauben im Zweifelsfall wenn sie
darauf angesprochen werden, dass die

252
00:19:25,000 --> 00:19:30,179
Algorithmen objektiv und unabhängig sind.
Und dabei beziehe ich mich auf folgende

253
00:19:30,179 --> 00:19:35,620
Studie. Die kommt aus der CHI, der
Computer Human Interaction Community. Und

254
00:19:35,620 --> 00:19:42,180
dort waren sich 62,5% der Teilnehmer und
Teilnehmerinnen in dieser Studie der

255
00:19:42,180 --> 00:19:47,659
Existenz von Newsfeed-Algorithmen, also
von dieser algorithmischen Kuration, nicht

256
00:19:47,659 --> 00:19:51,830
bewusst. Das heißt wir haben hier eine
qualitative Studie mit 40 TeilnehmerInnen,

257
00:19:51,830 --> 00:19:56,010
die so ausgewählt wurden, dass sie
repräsentativ sind für die US-

258
00:19:56,010 --> 00:20:00,980
Grundgesamtheit. Und von denen war also 25
Personen nicht bewusst, dass überhaupt

259
00:20:00,980 --> 00:20:06,580
irgendwie sortiert wird. Die Studie zeigt
auch, dass die TeilnehmerInnen durchaus

260
00:20:06,580 --> 00:20:11,029
verärgert sind, wenn sie Posts von engen
Freunden oder Familienmitgliedern nicht

261
00:20:11,029 --> 00:20:15,960
sehen. Spannend ist aber jetzt: Die
Teilnehmer suchen den Fehler eher bei sich

262
00:20:15,960 --> 00:20:19,330
oder anderen, als bei einem Algorithmus,
von dem sie im Zweifelsfall auch nichts

263
00:20:19,330 --> 00:20:24,660
wissen. Sie glauben dann z.B. dass sie
etwas übersehen haben oder sie denken,

264
00:20:24,660 --> 00:20:30,029
dass ihnen bestimmte Bekannte bewusst
Geschichten vorenthalten, weil sie

265
00:20:30,029 --> 00:20:33,649
vielleicht nicht so gut miteinander
bekannt sind, sich noch nicht so gut

266
00:20:33,649 --> 00:20:37,289
kennen. Daher kommt auch dieses
titelgebende Zitat: "I always assumed that

267
00:20:37,289 --> 00:20:41,480
I wasn't really that close to [that
person], so that's fine. What the hell?"

268
00:20:41,480 --> 00:20:45,130
Das heißt hier hat jemand gedacht "Okay,
ich sehe die Babyfotos vielleicht nicht,

269
00:20:45,130 --> 00:20:49,490
weil ich die Person nicht so gut kenne,
aber die Person hat das für alle geteilt".

270
00:20:49,490 --> 00:20:54,100
Und hier hat der Algorithmus jetzt die
Entscheidung getroffen, dass Person A das

271
00:20:54,100 --> 00:20:59,590
Baby von Person B nicht sieht. Das heißt
diese Systeme, die im Schatten agieren und

272
00:20:59,590 --> 00:21:04,090
denen sich die BenutzerInnen nicht bewusst
sind, haben Auswirkungen auf

273
00:21:04,090 --> 00:21:08,370
zwischenmenschliche Beziehungen. Sie
rekonfigurieren sie. Und darüber hinaus

274
00:21:08,370 --> 00:21:11,820
muss man sich auch noch einmal bewusst
machen, was diese Nachrichten-

275
00:21:11,820 --> 00:21:15,899
Empfehlungssysteme eigentlich erreichen
wollen. Sie sind ja von der Art her wie

276
00:21:15,899 --> 00:21:20,909
Netflix. Das heißt wenn ich auf Youtube
oder einem anderen Portal mir Videos

277
00:21:20,909 --> 00:21:24,990
angucke und ich gucke mir zehn Videos an
und davon sind vier mit lustigen Hunde-

278
00:21:24,990 --> 00:21:30,461
Babys, dann folgert das System "Ok,
Hendrik mag lustige Hunde-Babys. Dem zeige

279
00:21:30,461 --> 00:21:34,701
ich jetzt in Zukunft mehr lustige Hunde-
Babys". Nun sind aber auch Nachrichten auf

280
00:21:34,701 --> 00:21:39,350
Plattformen wie Youtube. Das heißt wenn
ich mir jetzt zehn Videos angucke und von

281
00:21:39,350 --> 00:21:43,710
denen geht es in vielen darum, dass
Flüchtlinge kriminell sind, dann empfiehlt

282
00:21:43,710 --> 00:21:48,720
mir das System Videos von kriminellen
Flüchtlingen. Das heißt da passiert etwas

283
00:21:48,720 --> 00:21:55,169
mit meiner Weltwahrnehmung. Das heißt so
derartige Filterblasen und Echokammern

284
00:21:55,169 --> 00:21:59,840
entstehen online. Die gibts natürlich auch
im echten Leben. Der Freundeskreis ist

285
00:21:59,840 --> 00:22:04,701
auch eine Echokammer, in der bestimmte
Weltvorstellungen geteilt werden, aber

286
00:22:04,701 --> 00:22:09,360
hier sind sie durchaus intransparenter,
denn es passiert unter dem gleichen Logo.

287
00:22:09,360 --> 00:22:14,830
Bei mir ist ein YouTube-Logo, bei euch ist
ein YouTube-Logo. Und das sind Probleme,

288
00:22:14,830 --> 00:22:18,190
denen wir uns stellen müssen, mit denen
wir umgehen müssen.

289
00:22:18,190 --> 00:22:22,820
Und das war mein Teil zur Perspektive der
Mensch-Computer-Interaktion, die sich also

290
00:22:22,820 --> 00:22:26,799
als eigenes Feld mit derartigen
Fragestellungen auseinandersetzt. Und ich

291
00:22:26,799 --> 00:22:31,370
übergebe jetzt an Karen, die nochmal
technisch ins Detail gehen wird.

292
00:22:31,370 --> 00:22:43,649
*Applaus*
Karen: Ja. Zum ersten Teil dieser Präsentation

293
00:22:43,649 --> 00:22:48,309
zeigten wir, dass Algorithmen uns schon
heute schon beeinflussen, bewusst und

294
00:22:48,309 --> 00:22:52,100
unbewusst, direkt und indirekt. Und wir
haben gesehen mit welcher Rigorosität ihre

295
00:22:52,100 --> 00:22:57,220
Voraussagen umgesetzt werden, nachdem sie
einmal zur Verfügung stehen. Das immer

296
00:22:57,220 --> 00:23:00,149
unter der Annahme der
Unvoreingenommenheit. Wir haben auch

297
00:23:00,149 --> 00:23:04,470
bereits angedeutet, dass dieses massive
Vertrauen nicht unbedingt angebracht ist.

298
00:23:04,470 --> 00:23:08,870
In diesem zweiten Teil der Präsentation
möchten wir darauf eingehen wann dieses

299
00:23:08,870 --> 00:23:12,019
Vertrauen nicht angebracht ist. Dabei
möchte ich besonders auf ein Wort

300
00:23:12,019 --> 00:23:17,320
eingehen, das wir bereits viel verwendet
haben. Das Wort Bias oder zu Deutsch

301
00:23:17,320 --> 00:23:20,630
Verzerrung. Beim maschinellen Lernen
können wir grundsätzlich in zwei

302
00:23:20,630 --> 00:23:24,050
verschiedene Formen von Bias
unterscheiden. Auf der einen Seite haben

303
00:23:24,050 --> 00:23:29,320
wir Bias der Daten, also Bias der ein
Spiegel ist unserer eigenen Vorurteile und

304
00:23:29,320 --> 00:23:33,090
Moralvorstellungen, ob uns das jetzt
bewusst ist oder nicht.

305
00:23:33,090 --> 00:23:37,110
Bias in Daten kann aber auch entstehen
ganz zufällig durch mangelhafte Erhebung

306
00:23:37,110 --> 00:23:42,890
von Daten. Wenn das passiert wird eine
Grundgesamtheit also die Population

307
00:23:42,890 --> 00:23:48,580
verzerrt abgebildet. Auf der anderen Seite
befindet sich der Bias durch das

308
00:23:48,580 --> 00:23:51,399
Modellieren.
Das sind also die Gesamtheit aller

309
00:23:51,399 --> 00:23:54,370
Annahmen die Ingenieure und
Wissenschaftler von Algorithmen machen und

310
00:23:54,370 --> 00:24:00,490
machen müssen, um überhaupt Voraussagen
treffen zu können. Dabei kann sich

311
00:24:00,490 --> 00:24:08,120
wiederum der Bias des Modells so auf die
Daten auswirken, dass der Bias in den

312
00:24:08,120 --> 00:24:11,919
Daten verringert wird. Dazu gibt es
vielfältige Forschung. Es kann aber auch

313
00:24:11,919 --> 00:24:18,630
den Bias in den Daten verstärken. Auf der
anderen Seite knn auch Bias in Daten den

314
00:24:18,630 --> 00:24:24,690
Modellier-Bias beeinflussen. Wir werden im
Folgenden, den folgenden 4 Beispielen, uns

315
00:24:24,690 --> 00:24:28,860
mit all diesen Phänomenen auseinander-
setzen. Maschinelles Lernen hat in den

316
00:24:28,860 --> 00:24:32,659
letzten Jahren viele Durchbrüche bei der
algorithmischen Wahrnehmung erzielt.

317
00:24:32,659 --> 00:24:37,250
Algorithmen bewältigen kognitive Aufgaben,
die vor kurzem in weiter Ferne schienen.

318
00:24:37,250 --> 00:24:42,220
Das hat aber auch eine Welle von Forschung
ausgelöst, die unlösbar geglaubte Aufgaben

319
00:24:42,220 --> 00:24:46,809
wieder aufgreift und neu bewertet.
Eine Studie dieser Welle ist im November

320
00:24:46,809 --> 00:24:52,779
letzten Jahres erschienen zwei Forscher
der Shanghai Jiaotong-Universität

321
00:24:52,779 --> 00:24:57,620
behaupten zeigen zu können, dass man
Menschen mit kriminellen Absichten bereits

322
00:24:57,620 --> 00:25:01,289
an einem einfachen Ausweis-Foto erkennen
kann und dies mit 90 prozentiger

323
00:25:01,289 --> 00:25:06,669
Trefferwahrscheinlichkeit. Dieses Ergebnis
steht natürlich im starken Kontrast zu den

324
00:25:06,669 --> 00:25:10,250
Forschungsergebnissen der letzten Dekaden,
die Kriminalität eher sozio-ökonomischen

325
00:25:10,250 --> 00:25:14,019
Umständen zuschreiben. Wir wollen uns also
im Folgenden mit dieser Studie ein

326
00:25:14,019 --> 00:25:19,929
bisschen näher beschäftigen. Die Autoren
sammelten hierzu 1800 Fotos von Chinesen

327
00:25:19,929 --> 00:25:24,740
im Alter zwischen 18 und 55 Jahren, die
keine bemerkbaren Gesichtsbehaarungen,

328
00:25:24,740 --> 00:25:30,120
Narben oder Tattoos zeigten. Dabei
repräsentieren zirka 700 Fotos die Rubrik

329
00:25:30,120 --> 00:25:35,889
kriminell. Die Fotos selbst wurden von der
Polizei bereitgestellt und es handelt sich

330
00:25:35,889 --> 00:25:39,669
bei allen Fotos um bereits verurteilte
Straftäter.

331
00:25:39,669 --> 00:25:42,730
Auf der anderen Seite mussten nun auch
Bilder rechtschaffender Bürger

332
00:25:42,730 --> 00:25:47,429
repräsentiert werden. Dafür wurden 1100
Fotos aus verschiedenen Quellen des

333
00:25:47,429 --> 00:25:50,750
Internets beschafft. Dabei ist anzunehmen,
dass diese von Seiten wie LinkedIn

334
00:25:50,750 --> 00:25:55,190
stammen, da die Autoren den Beruf der
vermeintlich rechtschaffenen kennen. Um

335
00:25:55,190 --> 00:25:59,679
uns nun ein besseres Bild über die Daten
zu machen, wollen wir uns also ein paar

336
00:25:59,679 --> 00:26:03,710
Datenpunkte anschauen.
Jeder dieser Reihe entsprechen drei

337
00:26:03,710 --> 00:26:07,629
Datenpunkte aus jeweils einer Kategorie
kriminell oder rechtschaffend.

338
00:26:07,629 --> 00:26:10,450
Dazu würde ich ein kleines Experiment
wagen. Also ich zähle dann gleich mal bis

339
00:26:10,450 --> 00:26:15,220
zwei und alle die glauben, die obere Reihe
seien die Rechtschaffenden, die bitte ich

340
00:26:15,220 --> 00:26:20,429
dann die linke Hand zu heben. Ich hebe die
rechte Hand, damit ihr wisst, welche Hand.

341
00:26:20,429 --> 00:26:24,140
Und diejenigen, die denken die untere
Reihe wären die Rechtschaffenden, die

342
00:26:24,140 --> 00:26:27,320
bitte ich also die rechte Hand zu heben.
Das können wir gleich mal probieren, also

343
00:26:27,320 --> 00:26:32,832
ich zähle nochmal bis 2: eins, zwei und
dann heben wir halt die Hand.

344
00:26:32,832 --> 00:26:36,620
Okay. Also die meisten von uns sind uns
relativ einig dass wir die rechtschaffenen

345
00:26:36,620 --> 00:26:40,549
identifizieren können. Aber warum können
wir das? Eigentlich sollten Menschen dazu

346
00:26:40,549 --> 00:26:45,190
ja nicht in der Lage sein und wir wissen,
dass wir dazu nicht in der Lage sind.

347
00:26:45,190 --> 00:26:49,870
Ich denke also die meisten von uns haben
gewisse Hinweise in den Bildern

348
00:26:49,870 --> 00:26:53,490
wahrgenommen, die auf der
Unterschiedlichkeit der Quellen beruhen.

349
00:26:53,490 --> 00:26:57,399
Also ganz offensichtlich hier der Kragen
im Bild, der darauf hinweist, dass es

350
00:26:57,399 --> 00:27:02,380
vielleicht ein Bewerbungsfoto sein könnte
oder ein leichtes Grinsen im Gesicht.

351
00:27:02,380 --> 00:27:07,440
Dahingegen sind die Leute, die auf der
kriminellen Seite sind nicht besonders

352
00:27:07,440 --> 00:27:10,360
vorteilhaft dargestellt. Also dem Mann
hier wird der Scheinwerfer ins Gesicht

353
00:27:10,360 --> 00:27:17,260
gestrahlt, was dann Hautunreinheiten und
Falten besonders betont. Wohingegen bei

354
00:27:17,260 --> 00:27:21,049
den Bewerbungsfotos offensichtlich Make-Up
im Spiel ist oder Photoshop. Im

355
00:27:21,049 --> 00:27:28,940
trivialsten Fall kann es also sein, dass
der Algorithmus einfach nur erkennt, in

356
00:27:28,940 --> 00:27:32,710
welchen Fotos Photoshop nachgeholfen hat.
Das kann man also zum Beispiel schon an

357
00:27:32,710 --> 00:27:37,500
lokalen Pixel Statistiken gut erkennen.
Diese Studie ist vielleicht ein extremes

358
00:27:37,500 --> 00:27:41,910
Beispiel, wie gravierend sich die
verwendeten Daten auf das Ergebnis einer

359
00:27:41,910 --> 00:27:45,730
Voraussage eines Algorithmus auswirken
können. Dies ist ein besonders starkes

360
00:27:45,730 --> 00:27:50,360
Beispiel für Stichproben-Verzerrung, also
Bias in dem Gruppen unterschiedlich

361
00:27:50,360 --> 00:27:53,710
dargestellt werden.
Bias kann aber auch entstehen ganz

362
00:27:53,710 --> 00:27:57,190
zufällig, wenn zu wenige Datenpunkte
vorhanden sind, um verlässliche Aussagen

363
00:27:57,190 --> 00:27:59,940
zu treffen.
Solche Probleme sehen wir also oft in

364
00:27:59,940 --> 00:28:04,929
medizinischen Studien oder psychologischen
Studien, wo Tests teuer und langwierig

365
00:28:04,929 --> 00:28:08,750
sind.
Melde-Bias beschreibt, wenn Befragte

366
00:28:08,750 --> 00:28:11,379
unkorrekte Angaben machen.
Das geschieht zum Beispiel oft bei

367
00:28:11,379 --> 00:28:15,529
Gewaltverbrechen, bei denen Angst und
Repression eine Rolle spielen. Und

368
00:28:15,529 --> 00:28:20,140
natürlich spielen auch die verwendeten
Merkmale, die ein gewisses Problem

369
00:28:20,140 --> 00:28:25,250
beschreiben sollen, eine große Rolle.
Kommen wir nun zur zweiten Kategorie: dem

370
00:28:25,250 --> 00:28:29,049
Bias in den Modellen.
Hat man sich früher also vor dem die

371
00:28:29,049 --> 00:28:33,590
Deeplearning-Hype, sagen wir mal vor 2012
eine Einführungsveranstaltung zum

372
00:28:33,590 --> 00:28:37,700
maschinellen Lernen gesetzt, dann begann
fast jeder mit dem Erklären des No-free-

373
00:28:37,700 --> 00:28:44,659
Lunch-Theorems. Also der Aussage, dass
kein Modell in allen möglichen Szenarien

374
00:28:44,659 --> 00:28:47,549
funktioniert.
Daraus schlussfolgerten wir, dass wir

375
00:28:47,549 --> 00:28:52,820
Annahmen machen müssen, die das Modell im
Hinblick auf unser spezifisches Problem

376
00:28:52,820 --> 00:28:58,120
beschränken. Diese Annahmen haben aber
ihre Grenzen. Dann versagt das Modell,

377
00:28:58,120 --> 00:29:00,399
ohne dass sich das Modell darüber bewusst
ist.

378
00:29:00,399 --> 00:29:07,230
Das heißt also unser Job als
Wissenschaftler oder Studierender ist es,

379
00:29:07,230 --> 00:29:14,890
diese Grenzfälle zu benennen und zu
testen, ob in unserem speziellen

380
00:29:14,890 --> 00:29:17,950
Anwendungsfall diese Algorithmen nicht
versagen.

381
00:29:17,950 --> 00:29:23,029
An diesen Prinzipien hat sich auch bis
heute nichts geändert, aber der Erfolg des

382
00:29:23,029 --> 00:29:25,490
maschinellen Lernens in bestimmten
Bereichen lässt selbst uns

383
00:29:25,490 --> 00:29:29,610
WissenschaftlerInnen diese universalen
Regeln manchmal vergessen.

384
00:29:29,610 --> 00:29:33,509
Wir sind dann versucht zu glauben, dass
Modelle so flexibel sind, dass die Grenzen

385
00:29:33,509 --> 00:29:37,000
quasi nicht mehr existieren.
Im Folgenden möchte ich aber auf ein

386
00:29:37,000 --> 00:29:40,970
Beispiel eingehen, das sich auch mit dem
Deeplearning-Hype gar nicht geändert hat.

387
00:29:40,970 --> 00:29:46,750
Und das ist das Problem der Zielsetzung
und die Frage, wie Erfolg zu bewerten ist.

388
00:29:46,750 --> 00:29:51,799
Am Beginn des Vortrags sprach Hendrik über
das Messen von Fehlern und, dass das

389
00:29:51,799 --> 00:29:55,049
Korrigieren dieser Fehler ein wichtiger
Mechanismus sei, um Algorithmen zu

390
00:29:55,049 --> 00:29:58,590
trainieren.
Doch was ein Fehler ist, ist oft nicht

391
00:29:58,590 --> 00:30:02,200
einfach zu bestimmen und es liegt in der
Hand des Ingenieurs zu definieren.

392
00:30:02,200 --> 00:30:04,321
Zum Beispiel wie messe ich Erfolg bei
YouTube-Empfehlungen?

393
00:30:04,321 --> 00:30:09,150
Messe ich die Zeit die jemand auf der
Plattform verbringt? Das kann aber auch

394
00:30:09,150 --> 00:30:12,220
bedeuten, dass der PC vielleicht noch
einer Ecke steht und die Personen gar

395
00:30:12,220 --> 00:30:15,710
nicht mehr im Raum ist oder messe ich die
Anzahl von Klicks? Aber wenn diese zu

396
00:30:15,710 --> 00:30:19,250
frequent sind, dann bedeutet das
vielleicht, dass die Person das Video gar

397
00:30:19,250 --> 00:30:23,580
nicht mag.
Ein anderes Problem sind Übersetzungen.

398
00:30:23,580 --> 00:30:32,170
Stellen Sie sich nur also vor, dass wir
einen Korpus von Übersetzungen haben und

399
00:30:32,170 --> 00:30:36,380
wir wollen messen, ob ein Text richtig
übersetzt wurde.

400
00:30:36,380 --> 00:30:43,620
Wie können wir das messen? Wort für Wort
oder Paragraph für Paragraph? Wenn wir

401
00:30:43,620 --> 00:30:46,870
Wort für Wort messen, dann spielen wir
vielleicht mit der Wortreihenfolge in

402
00:30:46,870 --> 00:30:49,299
verschiedenen Sprachen und das
funktioniert dann nicht so gut. Wenn wir

403
00:30:49,299 --> 00:30:53,659
Paragraph für Paragraph messen,
funktioniert das vielleicht nicht so gut,

404
00:30:53,659 --> 00:30:58,179
weil der Algorithmus den Kontext nicht
mehr begreift. Und wie gehen wir mit

405
00:30:58,179 --> 00:31:01,130
Synonymen um? Wenn also der Algorithmus
ein richtiges Synonymen gefunden hat, wird

406
00:31:01,130 --> 00:31:04,720
dann trotzdem ein Fehler berechnet, wenn
der spezielle Datenpunkt besagt, dass das

407
00:31:04,720 --> 00:31:08,340
vielleicht als ein anderes Synonym zu
übersetzen ist? Man muss also

408
00:31:08,340 --> 00:31:13,299
Entscheidungen treffen. Die Ingenieure bei
Google und anderen führenden

409
00:31:13,299 --> 00:31:20,970
Übersetzungssystem beantworten die Frage
folgendermaßen: Wir übersetzen Satz für

410
00:31:20,970 --> 00:31:25,880
Satz. Dabei gehen wir davon aus, dass
Sätze unabhängig sind und nur das

411
00:31:25,880 --> 00:31:30,049
wahrscheinlichste Wort oder die
wahrscheinlichste Phrase wird richtig

412
00:31:30,049 --> 00:31:35,380
bewertet. Wenn wir also nochmal auf das
Beispiel aus der ersten Hälfte des

413
00:31:35,380 --> 00:31:40,360
Vortrags eingehen. Wenn wir
nun "Sie ist eine Frau. Sie ist Ärztin" in

414
00:31:40,360 --> 00:31:45,690
das genderneutrale Türkisch übersetzen zu
"O bir kadın. O bir doktor." und dann

415
00:31:45,690 --> 00:31:51,090
zurückübersetzen ins Deutsche, dann wird
dies mit "Sie ist eine Frau. Er ist Arzt"

416
00:31:51,090 --> 00:31:55,200
übersetzt. Und jetzt wissen wir auch
warum. Da wir annahmen, dass Sätze

417
00:31:55,200 --> 00:31:58,779
unabhängig sind weiß der Algorithmus gar
nichts vom Kontext, also dass wir hier

418
00:31:58,779 --> 00:32:04,580
über eine Frau sprechen. Wenn der
Algorithmus "O bir doktor" dann übersetzt,

419
00:32:04,580 --> 00:32:08,360
übersetzt der nur die wahrscheinlichste
Phrase und die ist "Er ist Arzt". Es

420
00:32:08,360 --> 00:32:12,389
handelt sich hier also nicht um Bias in
den Daten oder zumindest nicht unbedingt,

421
00:32:12,389 --> 00:32:20,009
sondern um Bias in den Annahmen die das
Modell zu sehr vereinfachen. Ein zweites

422
00:32:20,009 --> 00:32:23,289
Beispiel führt das noch klarer vor Augen.
Wenn wir hier eben den Punkt durch ein

423
00:32:23,289 --> 00:32:30,830
Komma ersetzen, dann kann der Algorithmus
es richtig übersetzen, weil er sich des

424
00:32:30,830 --> 00:32:36,970
Kontexts bewusst ist. Im nächsten Beispiel
um das Phänomen Bias wollen wir zeigen wie

425
00:32:36,970 --> 00:32:39,909
Bias in Modellen Bias in Daten verstärken
kann.

426
00:32:39,909 --> 00:32:44,820
Dies wird besonders in sogenannten aktiven
Lernszenarien bewusst. Aktives Lernen

427
00:32:44,820 --> 00:32:52,190
funktioniert wie folgt. Wir haben Daten,
auf deren Grundlage wir einen Algorithmus

428
00:32:52,190 --> 00:32:55,990
lernen. Für manche Voraussagen sind wir
uns aber nicht sicher. Darum fragen wir

429
00:32:55,990 --> 00:32:59,990
einen menschlichen Experten um Rat und der
Algorithmus fragt dann meistens die

430
00:32:59,990 --> 00:33:06,950
folgende Frage: Habe ich diesen Datenpunkt
richtig bewertet? Und falls nicht, bitte

431
00:33:06,950 --> 00:33:11,970
um Feedback! Das führt dazu, dass der
Algorithmus in der Zukunft mehr Daten zur

432
00:33:11,970 --> 00:33:16,309
Verfügung gestellt bekommt, um dann besser
zu lernen und weniger oft um Hilfe fragen

433
00:33:16,309 --> 00:33:22,070
zu müssen. Das klingt gut. Und so viel zum
störungsfreien Ablauf. Was aber nun wenn

434
00:33:22,070 --> 00:33:27,070
ein Datenpunkt mit falschen oder
verzerrten Merkmalen beschrieben wird? Und

435
00:33:27,070 --> 00:33:31,399
dazu kommt, dass unser Mensch vielleicht
nicht so wachsam ist, wie wir in unserem

436
00:33:31,399 --> 00:33:37,420
Modell annehmen. Wir haben also eine
kleine Verzerrung im Datensatz, und die

437
00:33:37,420 --> 00:33:42,710
Annahme des idealen Menschen wird verletzt
in unserem eigentlichen Phänomen. Dieser

438
00:33:42,710 --> 00:33:47,909
falsche Datenpunkt wird also ignoriert.
Das führt dann dazu, dass, obwohl die

439
00:33:47,909 --> 00:33:52,490
Ursache der Verzerrung nicht mehr aktiv
ist, dieser Datenpunkt nun vermehrt wird

440
00:33:52,490 --> 00:33:57,000
aufgrund der Tatsache, dass der Mensch
nicht auf die Frage, habe ich diesen

441
00:33:57,000 --> 00:34:02,512
Datenpunkt richtig bewertet, reagiert.
Und das führt dann wiederum dazu, wenn man

442
00:34:02,512 --> 00:34:04,720
mehr
verzerrte Daten hat, dass diese mehr

443
00:34:04,720 --> 00:34:08,590
verzerrten Daten sich immer weiter
vermehren können. Wann kann ich das also

444
00:34:08,590 --> 00:34:13,710
jetzt in freier Wildbahn beobachten? Es
ist relativ schwer zu sagen, weil sich

445
00:34:13,710 --> 00:34:16,600
natürlich solche großen Player wie Google
oder Facebook nicht immer in die Karten

446
00:34:16,600 --> 00:34:21,320
blicken lassen. Aber ich denke ein Tweet
aus dem vergangenen Jahr lässt darauf

447
00:34:21,320 --> 00:34:27,090
schließen, dass das vielleicht hier
passiert sein könnte. Also eine

448
00:34:27,090 --> 00:34:30,679
Afroamerikanerin mit Kussmund, in der
Mitte unten, wird hier als Gorilla

449
00:34:30,679 --> 00:34:33,489
bezeichnet. Das ist eine
geschichtsträchtige Bezeichnung für

450
00:34:33,489 --> 00:34:37,130
Afroamerikaner in Amerika und hat
natürlich große Wellen geschlagen. Google

451
00:34:37,130 --> 00:34:41,190
erklärt die Ursache des Fehlers nicht
genau genug, um genau zu wissen, was ihn

452
00:34:41,190 --> 00:34:46,670
ausgelöst hat, aber zwei Probleme können
eine Rolle gespielt haben. Eins wäre, dass

453
00:34:46,670 --> 00:34:50,320
die Bildbeschreibung immer von Menschen
bereitgestellt wird, und die erlauben sich

454
00:34:50,320 --> 00:34:55,679
gerne mal zu trollen und verfälschen das
originale Datenset damit. Das kann aber

455
00:34:55,679 --> 00:34:59,180
nicht die einzige Ursache sein. Es kommt
also mindestens noch dazu, dass gewisse

456
00:34:59,180 --> 00:35:02,180
Gruppen von Menschen entweder einfach sehr
klein sind in einer Gesellschaft oder

457
00:35:02,180 --> 00:35:06,480
unterrepräsentiert sind. Und vielleicht
auch drittens, man muss schon sagen dass

458
00:35:06,480 --> 00:35:11,650
bei großen Tech-Firmen sehr wenig
Grenzszenarien oder Szenarien getestet

459
00:35:11,650 --> 00:35:15,560
werden. Wir denken da zum Beispiel an den
Microsoft Chatbot, der ganz ähnliche

460
00:35:15,560 --> 00:35:22,130
Phänomene gezeigt hat. Also der dann auch
sehr rassistische Chat-Nachrichten

461
00:35:22,130 --> 00:35:26,880
geschrieben hat. Das letzte relevante
Beispiel zum Thema Bias soll aus dem

462
00:35:26,880 --> 00:35:32,130
Bereich des übertragenden Lernens kommen.
Hierbei ist das Ziel das Lösen einer

463
00:35:32,130 --> 00:35:37,490
Aufgabe. Und diese Aufgabe hat aber nur
wenige Datenpunkte. Und das sind nicht

464
00:35:37,490 --> 00:35:40,960
genug, um den Algorithmus erfolgreich
lernen zu lassen. Aber es gibt eine

465
00:35:40,960 --> 00:35:44,950
ähnliche Aufgabe, die erfolgreich gelöst
werden kann. Und die Idee ist nun, dass

466
00:35:44,950 --> 00:35:50,100
gut funktionierende Modell zu verwenden um
unseren eigentlichen Problemen zu helfen.

467
00:35:50,100 --> 00:35:57,310
Diese Technik führt aber wieder zu
Verzerrungen, die nur schwer bestimmt und

468
00:35:57,310 --> 00:36:00,750
kontrolliert werden können.
Das wird klar, wenn wir ein konkretes

469
00:36:00,750 --> 00:36:04,440
Beispiel betrachten. Wir können eine ganze
Halle voll Roboterarme stellen, um ihnen

470
00:36:04,440 --> 00:36:10,180
bestimmte motorische Aufgaben
beizubringen. Aber selbst 1000 Roboterarme

471
00:36:10,180 --> 00:36:17,530
lernen nur mühsam. Was also gang und gäbe
ist in der modernen Robotik, sind dass man

472
00:36:17,530 --> 00:36:23,020
Systeme in Simulationen üben lässt.
Systeme werden also für Tausende Jahre in

473
00:36:23,020 --> 00:36:26,730
Simulationen geübt. Das ist natürlich aber
nie Realität. Also wir denken da an

474
00:36:26,730 --> 00:36:31,540
Gravitationssimulationen, die Fehler
enthalten kann. Lichtbedingungen, die

475
00:36:31,540 --> 00:36:34,910
nicht ganz real sind, oder der
idealisierte Roboterarm, der hier

476
00:36:34,910 --> 00:36:40,190
verwendet wird. In diesem Zusammenhang
möchte ich auch sagen, wie attraktiv auch

477
00:36:40,190 --> 00:36:44,100
die Zukunft mit selbstfahrenden Autos
erscheinen mag, mit ihren Versprechen nach

478
00:36:44,100 --> 00:36:47,970
mehr Platz in den Städten, weniger
Unfällen und effektiverer Verkehrsführung,

479
00:36:47,970 --> 00:36:51,581
so sollte man auch sehr skeptisch sein,
denn auch diese Systeme haben die meiste

480
00:36:51,581 --> 00:36:58,840
Lebenserfahrung in Simulationen gesammelt.
Eine ganz andere Betrachtungsweise auf

481
00:36:58,840 --> 00:37:03,140
Daten ist die der Datendichte. Daten
können dicht beieinander liegen oder weit

482
00:37:03,140 --> 00:37:09,380
voneinander entfernt. In Bereichen mit
vielen Daten ist es oft einfach korrekte

483
00:37:09,380 --> 00:37:13,650
Aussagen zu treffen. Neue Datenpunkte in
diesen Bereichen zu beschreiben nennt man

484
00:37:13,650 --> 00:37:18,640
Interpolation. Wohingegen Bereiche mit
wenigen Daten oder keinen Datenpunkten

485
00:37:18,640 --> 00:37:22,920
sehr schwer zu beschreiben sind. Diese
Aufgabe beschreibt man mit Extrapolation.

486
00:37:22,920 --> 00:37:27,692
Korrektes extrapolieren ist im Allgemeinen
nicht möglich oder nur möglich, wenn man

487
00:37:27,692 --> 00:37:30,500
korrekte Annahmen über den
Entstehungsprozess der Daten macht.

488
00:37:30,500 --> 00:37:35,790
Interpolieren, also das Wandern von einem
oder mehreren Datenpunkte zum anderen,

489
00:37:35,790 --> 00:37:40,570
kann so wichtige Fragen des Alltags
beantworten wie: Wie würde das Kind von

490
00:37:40,570 --> 00:37:46,650
Kim Jong-un und Donald J. Trump aussehen?
Neueste Anwendungen dieser Technik

491
00:37:46,650 --> 00:37:51,280
beinhalten auch das gezielte Verändern von
Video in Bild und Sprache. Beispielsweise

492
00:37:51,280 --> 00:37:55,470
wurde hier das Gesicht von der
Hauptdarstellerin des Wonder Woman Films,

493
00:37:55,470 --> 00:38:01,670
Gal Gadot, auf einen pornografischen Film
gelegt. Und man muss nicht weit denken um

494
00:38:01,670 --> 00:38:03,370
sich die Konsequenzen solcher Techniken,
für

495
00:38:03,370 --> 00:38:07,440
Fake News zum
Beispiel, vorzustellen. Im extremsten Fall

496
00:38:07,440 --> 00:38:12,420
gibt es sehr wenige oder keine Daten wo
eine Aussage getroffen werden soll. Nun

497
00:38:12,420 --> 00:38:16,220
ist es wichtig, die richtigen Annahmen zu
treffen um extrapolieren zu können. Das

498
00:38:16,220 --> 00:38:20,730
haben wir bereits gesagt. Das ist aber
eine extrem schwere Aufgabe, zu der auch

499
00:38:20,730 --> 00:38:24,750
moderne Wissenschaft nur wenige und
unvollständige Antworten weiß. Was also

500
00:38:24,750 --> 00:38:28,331
anstatt in aller Regel passiert, ist, dass
Algorithmen keine Annahmen machen. Und das

501
00:38:28,331 --> 00:38:33,630
kann zu unvorhergesehenen Phänomenen
führen. Im schlimmsten Fall kann man

502
00:38:33,630 --> 00:38:38,530
dieses Wissen auch nutzen zu sogenannten
feindlichen Attacken auf Algorithmen. Eine

503
00:38:38,530 --> 00:38:43,340
Attacke verläuft beispielsweise so: Man
nehme einen Datenpunkt aus dem Datenset

504
00:38:43,340 --> 00:38:47,430
und dessen beschreibende Merkmale, also
hier z.B. die Bilder von Verkehrsschildern

505
00:38:47,430 --> 00:38:48,430
und die Verkehrsschilder.

506
00:38:48,430 --> 00:38:49,430
[38:48]

507
00:38:49,430 --> 00:38:54,090
Man suche dann fernab von den Daten einen
Punkt der sehr ähnlich ist, den aber der

508
00:38:54,090 --> 00:38:58,830
Algorithmus mit all mit einem ganz anderen
Merkmal beschreiben würde. Und das

509
00:38:58,830 --> 00:39:08,910
gruselige ist, dass dies auch funktioniert
mit ausgedruckten Version derselben

510
00:39:08,910 --> 00:39:13,580
Attacke. Und wenn man nicht dieselben
Daten und nicht einmal denselben dasselbe

511
00:39:13,580 --> 00:39:19,470
Modell kennt oder verwendet. Wen das
interessiert dem empfehle ich sehr für die

512
00:39:19,470 --> 00:39:22,700
nächste Präsentation zu bleiben. Das wird
glaube ich ja der Kernpunkt der nächsten

513
00:39:22,700 --> 00:39:27,780
Präsentation sein. Abschließend zum Thema
Möchte ich nochmal ganz deutlich machen,

514
00:39:27,780 --> 00:39:33,350
dass in allen Systemen des modernen
maschinellen Lernens Korrelation evaluiert

515
00:39:33,350 --> 00:39:39,320
wird und nicht Kausalität. Mathematische
Kausalitätsforschung, also dem Suchen nach

516
00:39:39,320 --> 00:39:43,450
Ursache und Effekt für komplexe Systeme
ist erstens ein Kinderschuh und

517
00:39:43,450 --> 00:39:47,440
Korrelation zu finden und zu beschreiben
ist nur einer der Schritte der dazu nötig

518
00:39:47,440 --> 00:39:53,320
ist. Bevor ich die Frage dann- die Runde
für Fragen öffne haben Hendrik und ich

519
00:39:53,320 --> 00:39:56,050
noch ein Anliegen. Also ich hoffe wir
haben umfassend die technischen

520
00:39:56,050 --> 00:40:00,220
Möglichkeiten des maschinellen Lernens
dargestellt und welche Begrenzungen es

521
00:40:00,220 --> 00:40:06,150
aufweist. Letzteres soll und wird uns als
Gesellschaft aber nicht davon abhalten

522
00:40:06,150 --> 00:40:11,140
diese großartigen Fortschritte zu
geniessen. Also denken wir an Mediziner

523
00:40:11,140 --> 00:40:14,850
und Molekulare Biologie in denen diese
Techniken großes Versprechen und auch

524
00:40:14,850 --> 00:40:19,740
schon geliefert haben. Daraus ergeben sich
trotzdem große politische Fragen die uns

525
00:40:19,740 --> 00:40:23,490
alle etwas angehen. Entscheidungen die
Wissenschaftler nicht alleine treffen

526
00:40:23,490 --> 00:40:28,570
können, wollen oder sollten. Also wir
müssen uns Sachen fragen wie: Wer soll im

527
00:40:28,570 --> 00:40:32,810
konkreten Fall Entscheidungen treffen,
Menschen oder Maschinen. Wer ist Schuld

528
00:40:32,810 --> 00:40:38,500
wenn Fehler passieren: Ingenieure, Firmen,
Staat oder vielleicht gar niemand. Wie

529
00:40:38,500 --> 00:40:44,290
können staatliche Garantien wie Gleichheit
juristisch umgesetzt werden im Angesicht

530
00:40:44,290 --> 00:40:49,700
solcher neuen Algorithmen. Und natürlich
auch wie können Algorithmen oder sollten

531
00:40:49,700 --> 00:40:53,390
Algorithmen reguliert werden. An der
Stelle möchte ich mich bedanken für

532
00:40:53,390 --> 00:40:57,070
Aufmerksamkeit
und würde die Runde eröffnen für Fragen.

533
00:40:57,070 --> 00:41:12,620
Herald-Angel: Vielen Dank Karen, vielen

534
00:41:12,620 --> 00:41:19,430
Dank Hendrik. Wenn ihr Fragen habt, bitte
an den Mikros aufstellen. Und dann

535
00:41:19,430 --> 00:41:21,770
entsprechend warten. Mikrophon 1
bitteschön.

536
00:41:21,770 --> 00:41:24,420
Mikrofon 1: Ja, vielen Dank für den

537
00:41:24,420 --> 00:41:31,360
großartigen Vortrag, war super spannend
und es ist ein sehr sehr wichtiges Thema,

538
00:41:31,360 --> 00:41:35,900
wie gehen wir damit um, weil es wirklich
Auswirkungen hat auf die politische

539
00:41:35,900 --> 00:41:41,650
Organisation, auf die Demokratie, all
diese Sachen. Jetzt vom Beispiel das

540
00:41:41,650 --> 00:41:45,250
Hendrik gebracht hat, im ersten Teil
ging's ja jetzt auch zum Beispiel über die

541
00:41:45,250 --> 00:41:51,820
Anwendung von KI für ja sagen wir
politische Propaganda, könnte man auch

542
00:41:51,820 --> 00:41:58,300
sehen, Cambridge Analytica, die ganzen
Sachen und gleichzeitig als zweites Thema

543
00:41:58,300 --> 00:42:03,720
die Filterbubbles die sich bilden, also wo
natürlich eine Verstärkung dieses

544
00:42:03,720 --> 00:42:09,100
Phaenomens möglich ist. Meine Frage, die
ich mich in diesem Jahr gestellt habe, mit

545
00:42:09,100 --> 00:42:19,580
Brexit, mit Trumpwahlen und so weiter, was
sind die Möglichkeiten die sich bieten um

546
00:42:19,580 --> 00:42:26,890
dem entgegenzuwirken, dass sich Meinungen
so stark durch Filterbubbles polarisieren,

547
00:42:26,890 --> 00:42:33,860
dass Leute durch Targeted Advertisement
beeinflusst werden, die mit AI generiert

548
00:42:33,860 --> 00:42:41,060
werden und Big Data. Wie ja- habt ihr
konkrete Vorschläge?

549
00:42:41,060 --> 00:42:44,060
Hendrik: Vielen Dank für die Frage. Es

550
00:42:44,060 --> 00:42:47,900
geht also darum was man jetzt gegen diese
Probleme insbesondere im politischen

551
00:42:47,900 --> 00:42:52,620
Bereich machen kann. Und es ist natürlich
eine riesige Frage, wird uns warscheinlich

552
00:42:52,620 --> 00:42:57,400
auch noch lange Begleiten, ich glaube
kognitive Diversität im Bekannten- und

553
00:42:57,400 --> 00:43:02,630
Freundeskreis, ganz wichtig, vor allem aber
auch in Unternehmen. Und unsere Ansätze, so

554
00:43:02,630 --> 00:43:06,490
kommen sie ja zusammen, mir gehts ja darum
wie können wir Leute untersützten, wie

555
00:43:06,490 --> 00:43:09,931
machen wir Visualisierungen, wie machen
wir Algorithmen sichtbar, wie helfen wir

556
00:43:09,931 --> 00:43:13,861
den Leuten zu verstehen was da passiert.
Meine Perspektive, Karens Perspektive

557
00:43:13,861 --> 00:43:17,300
dann: Wie können wir die ALgorithmen, die
Blackbox aufmachen, wie können wir

558
00:43:17,300 --> 00:43:21,200
erklären, wie kann ein System auch sagen
wie sicher es ist mit seiner Vorhersage.

559
00:43:21,200 --> 00:43:28,280
Also es gibt ja auch viel Arbeit, es gibt
die Fairness, Transparency... Fairness,

560
00:43:28,280 --> 00:43:32,230
Accountability, and Transparency in
Machine Learning fatml.org. Da gibt es

561
00:43:32,230 --> 00:43:35,630
eine ganz große Gruppe von Leuten die sich
damit auseinandersetzt, auch aus ganz

562
00:43:35,630 --> 00:43:39,070
verschiedenen Richtungen, weil es gibt
viel Arbeit dazu in der Psychologie, in

563
00:43:39,070 --> 00:43:43,700
der Soziologie, aber auch halt in der
Informatik. Genau fatml.org ist eine sehr

564
00:43:43,700 --> 00:43:44,700
gute Addresse für sowas.

565
00:43:44,700 --> 00:43:50,630
Herald-Angel: Eine Bitte an die, die
gerade rausgehen: Macht das bitte so leise

566
00:43:50,630 --> 00:43:54,010
wie es geht und versucht durch die Tür zu
meiner Linken, zu eurer Rechten dort

567
00:43:54,010 --> 00:44:00,790
hinten, den Saal zu verlassen, danke
schön.

568
00:44:00,790 --> 00:44:04,790
Jawohl, Mikrofon 5, du hast eine Frage?

569
00:44:04,790 --> 00:44:08,960
Mikrophon 5: Ja, eher ein kurzer Kommentar
aus dem Bereich des Machine Learnings, ist

570
00:44:08,960 --> 00:44:13,170
das, was wir da gesehen haben bei der bei
dem Gorillabeispiel, ebenso bei dem

571
00:44:13,170 --> 00:44:18,550
Übersetzungsbeispiel nicht eher ein Bias
in der Kostenfunktion? Dadurch, dass wir

572
00:44:18,550 --> 00:44:22,380
dem Algorithmus gesagt haben, es ist
genauso teuer, wenn du die Klasse Gorilla

573
00:44:22,380 --> 00:44:27,410
mit der Klasse mit einer anderen Klasse
verwechselst, versus, dass wir die

574
00:44:27,410 --> 00:44:33,470
Oberklasse Mensch mit der Oberklasse Tier
verwechselst, oder in dem Genderbeispiel

575
00:44:33,470 --> 00:44:37,900
dass "Er" und "Sie" als Verwechselung
eines einzelnen Worts genauso teuer sind

576
00:44:37,900 --> 00:44:40,800
wie beliebige andere Worverwechselungen.

577
00:44:40,800 --> 00:44:44,620
Hendrik: Sehr guter Punkt. Also man kann
natürlich in der Kostenfunktion dagegen

578
00:44:44,620 --> 00:44:48,350
vorwirken, man kann sagen dieser Fehler
ist schlimmer für uns als der andere

579
00:44:48,350 --> 00:44:53,150
Fehler, aber wenn wir davon ausgehen, dass
alle Klassen gleich sind und wir einfach

580
00:44:53,150 --> 00:44:56,550
für alle Klassen gleich gute Ergebnisse
haben wollen, und das kommt ja aus Google

581
00:44:56,550 --> 00:45:01,030
Fotos, wo wir das für alle Kategorien
machen wollen, dann ist es halt da kommt

582
00:45:01,030 --> 00:45:04,180
der Mensch wieder rein. Das ist dann
nichtmehr allgemeines Machine Learning,

583
00:45:04,180 --> 00:45:07,520
sondern wieder so Frickellösung. Und
dieses Problem des Bias, und darum gings

584
00:45:07,520 --> 00:45:11,160
ja, ist einfach dem Machine Learning
inherent, und wir müssen damit umgehen.

585
00:45:11,160 --> 00:45:14,110
Und ich glaube nicht, dass man das einfach
in die Kostenfunktion schreiben kann. Oder

586
00:45:14,110 --> 00:45:15,560
willst du noch was dazu sagen?

587
00:45:15,560 --> 00:45:21,770
Karen: Ja der Punkt von dem Beispiel war
ja auch quasi wie einerseits da muss ein

588
00:45:21,770 --> 00:45:27,240
falscher Datenpunkt exestiert haben, und
wie das quasi durch die ein Bias

589
00:45:27,240 --> 00:45:30,350
vielleicht, oder eine Annahme in der
Kostenfunktion dann eigentlich noch viel

590
00:45:30,350 --> 00:45:34,900
verstärkt wird. Es geht ja darum wie quasi
eine Negativ-Spirale manchmal losgetreten

591
00:45:34,900 --> 00:45:38,240
werden kann. Dadurch, dass wir einerseits
Bias in den Daten haben, aber auch andere

592
00:45:38,240 --> 00:45:42,750
gewisse Annahmen machen, die vielleicht
die Realität zu sehr vereinfachen.

593
00:45:42,750 --> 00:45:44,540
Das war ja der Punkt dieses Beispiels.

594
00:45:44,540 --> 00:45:47,670
Hendrik: Und vielleicht dazu noch: Das
sind natürlich sehr offensichtliche

595
00:45:47,670 --> 00:45:50,970
Beispiele, auch um das hier deutlich zu
machen. Es gibt natürlich auch immer diese

596
00:45:50,970 --> 00:45:55,220
Blindstellen, Blindspots, wo halt was
passiert, von dem wir das garnicht wissen.

597
00:45:55,220 --> 00:45:57,530
Das ist ja auf eine Art auch ein
Blindspot, der vielleicht auch damit

598
00:45:57,530 --> 00:46:02,260
zusammenhängt, dass Google nicht divers
genug ist und nicht genug Leute derartige

599
00:46:02,260 --> 00:46:04,940
Daten damit getestet haben, bevor sie es
public gemacht haben.

600
00:46:04,940 --> 00:46:08,450
Herald-Angel: Mikrophon 1, deine Frage.

601
00:46:08,450 --> 00:46:11,420
Mikrophon 1: Ja vielen Dank, euer Vortrag

602
00:46:11,420 --> 00:46:15,290
war ja so ein bischen als Einführung
gedacht, das Thema auf die Agenda zu

603
00:46:15,290 --> 00:46:17,750
bringen, was ich ganz großartig finde,
aber deswegen hätte ich jetzt eher so eine

604
00:46:17,750 --> 00:46:21,820
Kommunikationsstrategische Frage. Ihr habt
ja ganz viel über Bias gesprochen, über

605
00:46:21,820 --> 00:46:25,260
Verzerrung, wenn man das so sagt denkt man
implizit ganz oft an neutral und

606
00:46:25,260 --> 00:46:29,940
Unverzerrt, und ich fands toll, du hattest
ja das No-Free-Lunch-Theorem da, also

607
00:46:29,940 --> 00:46:33,250
sagen: Machine Learning ohne Bias gibt's
garnicht, du hast auch gerade gesagt, das

608
00:46:33,250 --> 00:46:36,920
ist Machine-Learning inherent. Aber das
ist ja ganz wichtig zu sagen, deswegen

609
00:46:36,920 --> 00:46:40,080
wollte ich einfach mal fragen wenn es um
politische Debatten geht, um öffentliche

610
00:46:40,080 --> 00:46:44,260
Debatten geht, ob ihr dann denkt, dass
Bias und Verzerrung sozusagen der richtige

611
00:46:44,260 --> 00:46:48,770
Header ist, um das alles zu thematisieren.
Weil es eben dieses Neutrale, Unverzerrte

612
00:46:48,770 --> 00:46:52,880
immer mit impliziert, oder ihr denkt, dass
man das dann nochmal anders framen müsste.

613
00:46:52,880 --> 00:46:54,890
Hendrik: Wir sind aufjedenfall keine

614
00:46:54,890 --> 00:46:59,410
Kommunikationsstrategen. Es gibt natürlich
viele hervorragende Mediensoziologen,

615
00:46:59,410 --> 00:47:02,650
Kommunikationswissenschaftler, die das
warscheinlich viel besser machen können.

616
00:47:02,650 --> 00:47:07,950
Wir wollten jetzt erstmal in diesem Rahmen
zeigen, welche Probleme wir als Techniker,

617
00:47:07,950 --> 00:47:12,380
als Informatiker - wir promovieren ja
beide zu diesen Themen - sehen. Also...

618
00:47:12,380 --> 00:47:16,520
Also das ist wird uns ja aber auch noch
sehr lange beschäftigen, das richtig an

619
00:47:16,520 --> 00:47:17,520
die Leute zu bringen.

620
00:47:17,520 --> 00:47:22,860
Herald-Angel: Okay, Dankeschön. Wir haben
eine Frage aus dem IRC.

621
00:47:22,860 --> 00:47:25,540
Signal-Angel: Ja, danke, eine Frage aus

622
00:47:25,540 --> 00:47:28,530
dem Internet: Hat menschliches Lernen
nicht genau genommen die selben Probleme

623
00:47:28,530 --> 00:47:32,730
wie maschienelles Lernen? Oder gibt es da
im Prinzipiellen Unterschiede?

624
00:47:32,730 --> 00:47:38,750
Hendrik: Ich guck mal zu dir.

625
00:47:38,750 --> 00:47:42,590
Karen: Also, das ist eine Frage, die

626
00:47:42,590 --> 00:47:44,441
natürlich nicht nur das maschienelle
Lernen betrifft, sondern auch die

627
00:47:44,441 --> 00:47:48,690
Psychologie, oder die Evolutionsforschung,
zu der ich mich nicht auskenne. Der

628
00:47:48,690 --> 00:47:56,680
Algorithmus oder die Idee, die Grundidee
des maschienellen Lernens ist ja quasi

629
00:47:56,680 --> 00:48:01,720
Fehler festzustellen, und die dann zu
kommunizieren und das Modell wird dann

630
00:48:01,720 --> 00:48:05,890
daraufhin besser. Ob das jetzt bei uns
Menschen so funktioniert, ich bin mir

631
00:48:05,890 --> 00:48:12,250
nicht sicher ob das jemals jemand genauso
gesagt hat. Aber ich glaube im Sinne von,

632
00:48:12,250 --> 00:48:19,020
dass unser Gehirn optimiert, das wird,
oder das habe ich bestreiten gehört von

633
00:48:19,020 --> 00:48:24,400
Psychologen. Also die Frage ist nicht so
sehr wie, oder das Problem, dass ich mit

634
00:48:24,400 --> 00:48:26,770
der Frage habe ist nicht so sehr wie jetzt
das maschienelle Lernen funktioniert,

635
00:48:26,770 --> 00:48:29,590
sondern wie wir selbst funktionieren. Ich
glaube wir sind gerade auf dem Weg das

636
00:48:29,590 --> 00:48:34,540
herauszufinden und die Modelle des Machine
Learnings, maschienellen Lernens sind oft

637
00:48:34,540 --> 00:48:39,100
nur grobe Vereinfachungen dafür wie wir
selbst funktioneren.

638
00:48:39,100 --> 00:48:40,790
Hendrik: Genau, ich würde auch sagen, es

639
00:48:40,790 --> 00:48:44,930
ist bio-inspiriert, aber es gab auch eine
Zeit wo alles Maschienen waren, der Körper

640
00:48:44,930 --> 00:48:48,550
als Maschine. Das ist halt die Metapher
ihrer Zeit. Jetzt haben wir diese

641
00:48:48,550 --> 00:48:52,400
künstlichen neuronalen Netzwerke und jetzt
sind das die Metaphern, die wir nutzen,

642
00:48:52,400 --> 00:48:55,570
also ich glaube da ist ein fundamentaler
Unterschied zwischen menschlichem und

643
00:48:55,570 --> 00:48:56,570
künstlichem Lernen.

644
00:48:56,570 --> 00:49:00,530
Karen: Ja es gibt auch so einen zentralen
Leitsatz im maschinellen Lernen, der

645
00:49:00,530 --> 00:49:05,170
besagt, dass alle Modelle falsch sind, und
einige vielleicht nützlich sind. Und ich

646
00:49:05,170 --> 00:49:08,470
denke das trifft auch auf uns Menschen zu,
alle Modelle die wir verwenden, alle

647
00:49:08,470 --> 00:49:11,510
Annahmen die wir machen, alle Stereotypen
die wir benutzen, die sind vielleicht

648
00:49:11,510 --> 00:49:17,130
manchmal nützlich, aber in der Gesamtheit
immer falsch. Ich denke das trifft für

649
00:49:17,130 --> 00:49:25,060
Menschen und Maschinen zu.
*Applaus*

650
00:49:25,060 --> 00:49:28,171
Herald-Angel: Dankeschön. Mikrophon 4,

651
00:49:28,171 --> 00:49:29,171
deine Frage.

652
00:49:29,171 --> 00:49:36,860
Mikrophon 4: Vielleicht eine etwas naive
Frage, aber bestehen oder gibt es Metriken

653
00:49:36,860 --> 00:49:43,560
um diesen Bias, der uns täglich im Netz
begegnet, zu bewerten? Also dass man das

654
00:49:43,560 --> 00:49:49,330
schon visualisieren kann oder vermitteln
kann, dass man sich in einem hohen Bias

655
00:49:49,330 --> 00:49:56,250
also einer hohen Verzerrung bewegt oder
auf Glatteis läuft in dem Sinne. Ein hoch

656
00:49:56,250 --> 00:50:04,080
komplexes Thema wirklich, runtergebrochen
auf eine, ich sag mal, Bewusstbarmachung

657
00:50:04,080 --> 00:50:08,230
von hoher statistischer Verzerrung, die
einen umgibt.

658
00:50:08,230 --> 00:50:10,870
Hendrik: Also es gibt durchaus Forschung

659
00:50:10,870 --> 00:50:14,870
in die Richtung es gibt z.B. die Civic
Media Group am MIT Media Lab die sich mit

660
00:50:14,870 --> 00:50:18,341
soetwas aueinandersetzt. Das sind aber so
einzelne Beispiele wo sie z.B. Leuten

661
00:50:18,341 --> 00:50:22,080
einfach mal zeigen, was für einen Gender-
Bias sie bei den Leuten, die sie auf

662
00:50:22,080 --> 00:50:26,250
Twitter folgen, haben, also die folgen nur
Männern z.B..

663
00:50:26,250 --> 00:50:30,350
Solche Bewusstbarmachungen sind wichtig
und sind glaube ich auch ein Teil des

664
00:50:30,350 --> 00:50:33,020
Puzzels, aber ich glaube die
Medienpädagogik muss halt ernstgenommen

665
00:50:33,020 --> 00:50:36,180
werden, den Leuten muss das bewusst sein
wenn wir diese Dinger benutzen wollen,

666
00:50:36,180 --> 00:50:40,930
wenn wir in solchen Autos rumfahren
wollen, dann müssen wir das verstehen. Es

667
00:50:40,930 --> 00:50:44,560
gibt halt immer diese Blindspots und man
kann einfach da nicht darauf eingehen, man

668
00:50:44,560 --> 00:50:47,460
kann nicht jeden Spot da bedenken vorher.

669
00:50:47,460 --> 00:50:54,240
Karen: Um die vielleicht Frage zu
kontextualisieren von den Algorithmus-

670
00:50:54,240 --> 00:50:59,540
Wissenschaftlichen-Blickpunkt. Wir machen
jetzt nicht unbedingt den Unterschied

671
00:50:59,540 --> 00:51:04,160
zwischen vielleicht dem was eine negative
oder positive Verzerrung ist, also

672
00:51:04,160 --> 00:51:09,440
wahrgenommen wird, sondern für uns gibt es
halt nur Merkmale die auf gewisse andere

673
00:51:09,440 --> 00:51:13,650
Merkmale schließen lassen und das führt
dann wieder zu der Frage der Korrelation

674
00:51:13,650 --> 00:51:21,930
und wenn wir sagen wir haben oft ja
Merkmale die Proxys sind für andere

675
00:51:21,930 --> 00:51:28,920
Merkmale, also wo ich wohne ist oft proxy
dafür wie ich aussehe oder woher ich

676
00:51:28,920 --> 00:51:31,960
komme.
Was ich also im Machine Learning machen

677
00:51:31,960 --> 00:51:34,580
kann, oder wie sich die Wissenschaft damit
auseinandersetzt ist zu sagen, ok, wenn

678
00:51:34,580 --> 00:51:42,920
ich weiß welche Merkmale sensitiv sind,
also welche ich nicht möchte dass die mein

679
00:51:42,920 --> 00:51:46,590
System korreliert mit der eigentlichen
Aussage die das System treffen soll, dann

680
00:51:46,590 --> 00:51:54,210
kann quasi ich in meine Fehlerfunktion
einen extra Term reinspeisen, der sagt du

681
00:51:54,210 --> 00:52:00,390
dekorrelierst jetzt das Ergebnis was du
hast mit dem besonderen Merkmal was du als

682
00:52:00,390 --> 00:52:06,380
sensitiv also z.B. der Wohnort oder dein
Bildungsstatus oder dein Einkommen, dass

683
00:52:06,380 --> 00:52:10,900
die keine Rolle spielen dafür, wie der
Algorithmus Vorraussagen macht.

684
00:52:10,900 --> 00:52:15,630
Mikrophon 4: Was ich jetzt meinte war

685
00:52:15,630 --> 00:52:19,790
jetzt wirklich nicht die Unterscheidung
zwischen gut und schlecht, sondern

686
00:52:19,790 --> 00:52:25,360
wirklich eine Visualisierung, dieser
Datensatz oder dieses Ergebnis basiert auf

687
00:52:25,360 --> 00:52:31,590
wenigen Datensichten -- klar im Kontext
kompliziert zu bewerkstelligen, aber dass

688
00:52:31,590 --> 00:52:37,520
man eine Möglichkeit findet sowas
darzustellen dass diese Daten auf einer

689
00:52:37,520 --> 00:52:40,790
hohen Datendichte basieren und so weiter.

690
00:52:40,790 --> 00:52:46,020
Hendrik: Unsere Antwort is quasi, es gibt
solche Sachen, es gibt sowas zu messen

691
00:52:46,020 --> 00:52:50,520
aber es ist immer eine Reduktion von
Komplexität und da verliert man immer was

692
00:52:50,520 --> 00:52:53,970
und da muss man sich immer bewusst machen,
wie viel reduzieren dürfen wir, wie

693
00:52:53,970 --> 00:52:55,810
einfach dürfen wir es machen.

694
00:52:55,810 --> 00:52:59,730
Karen: Zur Frage der Datensichte kann
man vielleicht noch sagen, da ist wieder

695
00:52:59,730 --> 00:53:05,190
ein andere Kernansatz, der Bayesianische
Kernansatz, der sich jetzt nicht die Frage

696
00:53:05,190 --> 00:53:10,010
stellt, wie ist meine Hypothese aufgrund
der vorhandenen Daten zu bewerten sondern

697
00:53:10,010 --> 00:53:14,080
wie sind meine Daten aufgrund der
verwedeten Hypothese zu bewerten. Das ist

698
00:53:14,080 --> 00:53:18,390
also nochmal eine ganz andere Ansicht auf
die Sache und der wiederum erlaubt uns

699
00:53:18,390 --> 00:53:22,240
dann gewisse Unsicherheiten auszudrücken
über Vorrausagen, die ich treffe. Also

700
00:53:22,240 --> 00:53:26,030
wenn jetzt zum Beispiel ein Datenpunkt
über den ich eine Aussage treffen will

701
00:53:26,030 --> 00:53:30,740
weitab liegt von Daten die ich habe, dann
wird dieser Ansatz oder wenn ich diesen

702
00:53:30,740 --> 00:53:34,200
Ansatz verwende wird mir dann sagen; über
die Voraussage die ich jetzt treffe bin

703
00:53:34,200 --> 00:53:37,880
ich sehr unsicher und das ist eine
Forschungsrichtung mit der sich viele

704
00:53:37,880 --> 00:53:44,210
Leute beschäftigen, die jetzt aber für
diese großen, komplexen Systeme, ich würde

705
00:53:44,210 --> 00:53:46,380
sagen, noch sehr am Anfang steht.

706
00:53:46,380 --> 00:53:48,840
Herald-Angel: Mikrofon 1 bitte.

707
00:53:48,840 --> 00:53:53,460
Mikrofon 1: Danke für den super-
interessanten Vortrag und danke auch an

708
00:53:53,460 --> 00:53:57,040
die Gebärden-Dolmetscherin, die hier ohne
Unterlass die ganze Zeit übersetzt.

709
00:53:57,040 --> 00:54:10,450
*Applaus*
Ich habe folgende Frage: Wie nützlich

710
00:54:10,450 --> 00:54:15,970
würdet ihr es einschätzen, das mit einer
Qualitätskontrolle also einem

711
00:54:15,970 --> 00:54:21,020
Qualitätsmeilenstein für das Endergebnis
zu kombinieren. Also als Beispiel; ein

712
00:54:21,020 --> 00:54:26,750
Auto ist dann hinreichend gut, wenn es im
Verkehr weniger Leute umbringt als ein

713
00:54:26,750 --> 00:54:31,910
durschnittlicher menschlicher Fahrer oder
sowas. Würde das einen zusätzlichen Nutzen

714
00:54:31,910 --> 00:54:36,060
ergeben? Kann man daraus noch mehr
Rückschlüsse ziehen, oder sind das völlig

715
00:54:36,060 --> 00:54:37,230
getrennte Sachen?

716
00:54:37,230 --> 00:54:41,530
Karen: Also das ist eigentlich genau das
worauf wir hinaus wollten, dass das eine

717
00:54:41,530 --> 00:54:44,260
politische Frage ist, die wir nicht
beantworten wollen.

718
00:54:44,260 --> 00:54:45,260
Hendrik: Oder eine juristische.

719
00:54:45,260 --> 00:54:46,580
Karen: Oder eine juristische, das müsst

720
00:54:46,580 --> 00:54:49,220
ihr sagen, was ihr richtig findet, das ist
doch nicht unsere Aufgabe zu sagen ...

721
00:54:49,220 --> 00:54:50,271
Hendrik: Nein also die Gesellschaft muss

722
00:54:50,271 --> 00:54:53,590
es aushandeln, wir können Probleme
aufzeigen, aber die Antwort muss die

723
00:54:53,590 --> 00:54:55,020
Gesellschaft als ganzes finden.

724
00:54:55,020 --> 00:54:59,000
Mikrophon 1: Das ist klar, die Frage ist
nur, wenn man so einen Punkt definiert hat

725
00:54:59,000 --> 00:55:02,430
und sich dann die Ergebnisse anschauen
würde, die kurz vor und kurz nach diesem

726
00:55:02,430 --> 00:55:06,010
Punkt aufgetreten sind, ob das
Rückschlüsse zulassen würde auf

727
00:55:06,010 --> 00:55:09,539
irgendeinen Bias oder irgendwelche anderen
Sachen, oder ob dieser Punkt völlig

728
00:55:09,539 --> 00:55:11,180
unerheblich für euch wäre.

729
00:55:11,180 --> 00:55:13,550
Hendrik: Kannst du nochmal den Punkt
benennen?

730
00:55:13,550 --> 00:55:15,250
Mikrophon 1: Also man definiert

731
00:55:15,250 --> 00:55:20,990
irgendeinen Punkt x, der ein bestimmtes
Qualitätskriterium hat. Also der Wagen

732
00:55:20,990 --> 00:55:25,330
bringt eben nicht mehr Menschen um als ein
durchschnittlicher Fahrer sondern weniger.

733
00:55:25,330 --> 00:55:32,900
Sind die Ergebnisse die um diesen Punkt
liegen, die man dann messen kann. Sind die

734
00:55:32,900 --> 00:55:36,160
in irgendeiner Art relevant für den
Ausgang, kann man da irgendwelche

735
00:55:36,160 --> 00:55:40,030
Rückschlüsse daraus ziehen, oder ist das
nur irgendein Punkt, wie jeder andere

736
00:55:40,030 --> 00:55:41,030
auch?

737
00:55:41,030 --> 00:55:44,220
Hendrik: Also ich finde das problematisch,
diesen Punkt zu finden, weil man ja auch

738
00:55:44,220 --> 00:55:47,970
den ganzen Kontext sehen muss bei den
Autounfällen und warum sie passieren, also

739
00:55:47,970 --> 00:55:52,061
welche Gründe sie haben und das ganze
datafizieren, das in einen Punkt zu

740
00:55:52,061 --> 00:55:55,850
pressen, und den dann als
Evaluationsmetrik für was anderes

741
00:55:55,850 --> 00:55:58,695
hochkomplexes zu nehmen halte ich für sehr
problematisch, ich glaube da ist wirklich,

742
00:55:58,695 --> 00:56:02,300
das meint Karen, die politsche Antwort
wichtiger.

743
00:56:02,300 --> 00:56:04,600
Karen: Beim konkreten Beispiel von

744
00:56:04,600 --> 00:56:07,640
selbstfahrenden Autos muss man natürlich
auch sagen, dass es das echte

745
00:56:07,640 --> 00:56:11,470
selbstfahrende Auto nie üben kann einen
Crash zu haben, also dieses Crash-Szenario

746
00:56:11,470 --> 00:56:14,100
kann natürlich nie geübt werden, also wir
wollen da ja natürlich niemanden sterben

747
00:56:14,100 --> 00:56:18,240
lassen oder nicht so viele Autos crashen,
das ist ein bisschen teuer. Das heißt

748
00:56:18,240 --> 00:56:21,940
Crash-Szenarios werden eigentlich auch
immer nur in der Simulation geübt und das

749
00:56:21,940 --> 00:56:26,500
ist genau das Problem, dass wir heute --
zumindest soweit ich das weiß -- sehr

750
00:56:26,500 --> 00:56:31,890
wenige Szenarien haben in denen wir sagen
können; wenn wir jetzt in der Simulation

751
00:56:31,890 --> 00:56:37,910
geübt haben, was für Annahmen übernehmen
wir denn dann in die echte Welt. Die

752
00:56:37,910 --> 00:56:43,140
einfach nur benennen zu können würde uns
ja schon helfen eventuelle Fehlerszenarien

753
00:56:43,140 --> 00:56:47,100
vorrauszusagen, aber selbst das Benennen
dieser Annahmen das fällt uns ja selbst

754
00:56:47,100 --> 00:56:52,080
schon schwer, also das ist noch ein weiter
Weg.

755
00:56:52,080 --> 00:56:53,920
Herald-Angel: Mikro 1

756
00:56:53,920 --> 00:56:58,800
Mikrofon 1: Auch vielen Dank für den

757
00:56:58,800 --> 00:57:05,630
Vortrag. Die ganze Diskussion über die
Biase, die ihr ja getrieben habt, besagt

758
00:57:05,630 --> 00:57:09,120
ja letztlich, dass es darum geht die
Wahrheit zu finden, Wahrheit und letztlich

759
00:57:09,120 --> 00:57:13,480
eine Stichprobe der Wahrheit dem Computer
zum Lernen zu geben und das bringt mich

760
00:57:13,480 --> 00:57:16,600
dann zu der Parallele in der Wissenschaft
haben wir das ja auch, also wie sieht

761
00:57:16,600 --> 00:57:21,230
meine Stichprobe aus, die ideale
Stichprobe, oder ist da ein Bias drin.

762
00:57:21,230 --> 00:57:25,590
Habt ihr diese Parallele schonmal
gedanklich gezogen oder ist das ... ja.

763
00:57:25,590 --> 00:57:28,060
Hendrik: Also wir sind ja Wissenschaftler

764
00:57:28,060 --> 00:57:31,940
und wir müssen natürlich auch erstmal für
uns wissen, ob was wir herasugefunden

765
00:57:31,940 --> 00:57:35,540
haben, gerade wenn wir mit Menschen
arbeiten, wir hatten ja gestern auch den

766
00:57:35,540 --> 00:57:42,170
Vortrag "Science is broken", der da
irgendwie, also es ist immer schwierig die

767
00:57:42,170 --> 00:57:45,920
richtige Samplesize zu haben um die
Effectsize zu berücksichtigen, um zu

768
00:57:45,920 --> 00:57:48,550
wissen, dass man was weiß, das sind ja
epistemische Fragen.

769
00:57:48,550 --> 00:57:49,990
Mikrophon 1: Aber gibt's da irgendwie

770
00:57:49,990 --> 00:57:54,440
schon für neuronale Netze irgendwelche
Richtwerte, dass man dann irgendwie weiß.

771
00:57:54,440 --> 00:57:58,510
Weil in der Psychologie lernt man, dass
die Sampelsize muss mindestens 5.000 Bla

772
00:57:58,510 --> 00:58:01,690
betragen, keine Ahnung, oder so und so
Prozente. Gibt's Richtwerte, gibt's sowas

773
00:58:01,690 --> 00:58:07,440
schon für neuronale Netze? In Abhängigkeit
der Layer oder der Parameter oder..?

774
00:58:07,440 --> 00:58:09,700
Hendrik: Nicht dass ich wüsste, weisst du

775
00:58:09,700 --> 00:58:10,700
was?

776
00:58:10,700 --> 00:58:14,200
Karen: Die Frage geht jetzt vielleicht ein
bisschen tief. Für frühe Systeme, also

777
00:58:14,200 --> 00:58:22,680
sehr einfache neuronale Netze, die aus den
Anfang der 90ern, so wie Boltzmann-machines oder

778
00:58:22,680 --> 00:58:28,990
Hofman-Networks. Für solche Sachen kann
man sagen, wenn die Saturieren und mit

779
00:58:28,990 --> 00:58:34,800
wievielen Bits an Daten man da reingeht
bis die Saturieren. Für aber diese hoch-

780
00:58:34,800 --> 00:58:40,590
nicht-linearen Systeme, die wir jetzt
verwenden, kann man das nicht sagen, oder

781
00:58:40,590 --> 00:58:47,370
nur asymptothisch sagen. Es gibt viel
Forschung zu dem Thema, aber nichts, was

782
00:58:47,370 --> 00:58:50,721
jetzt besonders handfest wäre; sagen wir
mal so. Oder man jetzt im echten Leben

783
00:58:50,721 --> 00:58:51,721
verwenden könnte.

784
00:58:51,721 --> 00:58:56,000
Mikrophon 1: Ja gut, dann irgendwie so
eine Ausage zu haben, so und so viele

785
00:58:56,000 --> 00:58:58,760
Testdatensampels brauchst du für dein
neuronales Netz, wenn das so und so

786
00:58:58,760 --> 00:59:02,990
strukturiert ist. Irgendwie, das könnte
vielleicht eine Form von Verifikation oder

787
00:59:02,990 --> 00:59:05,750
Validierung, Pre-Validierung bringen,
irgendwie.

788
00:59:05,750 --> 00:59:08,350
Hendrik: Ja, das macht man ja. Man hat ja

789
00:59:08,350 --> 00:59:12,130
einen großen Datensatz, einen
Trainingsdatensatz, einen Testdatensatz

790
00:59:12,130 --> 00:59:15,940
und einen Validierungsdatensatz, mit dem
man dann nochmal guckt, was haben wir

791
00:59:15,940 --> 00:59:18,740
wirlich gelernt und haben wir nicht
einfach nur die Eigenheiten des

792
00:59:18,740 --> 00:59:22,220
Datensatzes auswendig gelernt. Haben wir
wirklich generalisiert. Also auf dem

793
00:59:22,220 --> 00:59:26,370
Niveau passiert das schon. Auf dem höheren
Niveau wäre das bestimmt noch eine

794
00:59:26,370 --> 00:59:27,530
hervorragende Doktorarbeit.

795
00:59:27,530 --> 00:59:30,430
Herald-Angel: Mikro 5, deine Frage?

796
00:59:30,430 --> 00:59:36,680
Mikrofon 5: Vielen Dank für den Vortrag.
Meine Frage ist: Diese Biases, die sind ja

797
00:59:36,680 --> 00:59:40,710
jetzt nicht neu, die kennt man ja seit
Dekaden in der Statistik. Was hat sich

798
00:59:40,710 --> 00:59:46,610
denn mit der künstlichen Intelligenz, bzw.
mit Deep Learning geändert? Und daran

799
00:59:46,610 --> 00:59:51,860
anschließend: Kennt ihr irgendwelche
Studien, dass solche Filterblasen wirklich

800
00:59:51,860 --> 00:59:55,040
irgendwelche tatsächlichen messbaren
Auswirkungen haben? Weil man hört

801
00:59:55,040 --> 00:59:59,850
unglaublich viel in den Medien, aber mir
ist keine belastbare Studie bekannt, die

802
00:59:59,850 --> 01:00:05,850
sagt, dass das da tatsächlich was
verschlimmert wird, was nicht vorher schon

803
01:00:05,850 --> 01:00:07,160
da war.

804
01:00:07,160 --> 01:00:10,530
Hendrik: Ich hab die erste Frage schon
wieder vergessen. Kannst du einmal noch

805
01:00:10,530 --> 01:00:11,530
die erste sagen?

806
01:00:11,530 --> 01:00:16,580
Mikrophon 5: Die erste Frage war, was sich
geändert hat, weil diese Biases, die sind

807
01:00:16,580 --> 01:00:17,580
ja jetzt nicht neu.

808
01:00:17,580 --> 01:00:20,570
Hendrik: Genau, nein, die sind natürlich
nicht neu. Und die ganzen Vorurteil sind

809
01:00:20,570 --> 01:00:24,060
auch nicht neu. Ich glaube, es wird halt
einfach sehr, sehr viel Machine Learning

810
01:00:24,060 --> 01:00:27,710
gerade benutzt. Auch aus sehr guten
Gründen. Also, z.B. es gibt hervoragende

811
01:00:27,710 --> 01:00:31,650
Python Bibliotheken, es gibt hervoragende
R Bibliotheken, die das super einfach

812
01:00:31,650 --> 01:00:37,090
machen. Die Unis lehren das fast überall.
Data Science ist der große Hypeterm, und

813
01:00:37,090 --> 01:00:39,810
das wird einfach nur nochmal drängender,
weil Leute diese Sachen jetzt auf einmal

814
01:00:39,810 --> 01:00:44,340
in ihre Systeme reinschmeißen, die
benutzen, um vielleicht Geld zu verdienen,

815
01:00:44,340 --> 01:00:49,640
sich aber dann dieser Probleme gar nicht
bewusst sind. Und zur 2. Frage: Ich bin

816
01:00:49,640 --> 01:00:52,780
mir ziemlich sicher, dass es viel zu
Echokammern gibt. Ich weiß nicht, was du

817
01:00:52,780 --> 01:00:56,950
gefragt hast, ob man das wirklich auch
wissenschaftlich so testen kann? Also, wie

818
01:00:56,950 --> 01:01:01,560
da quasi der Versuchsaufbau aussähe? Aber
es gibt, auch gerade in der Soziologie,

819
01:01:01,560 --> 01:01:10,300
viel zu Echokammern. Aber mir fällt gerade
kein Autor ein dazu.

820
01:01:10,300 --> 01:01:12,620
Herald-Angel: Vielen Dank für den Vortrag.

821
01:01:12,620 --> 01:01:15,560
Ich sehe, dass da noch Fragen sind, aber
leider ist die Zeit rum. Seid ihr noch da?

822
01:01:15,560 --> 01:01:16,980
Können die Leute euch noch ansprechen?

823
01:01:16,980 --> 01:01:17,670
Hendrik: OK.

824
01:01:17,670 --> 01:01:20,410
Herald-Angel: Super. Vielen, vielen Dank!

825
01:01:20,410 --> 01:01:23,790
*Applaus*

826
01:01:23,790 --> 01:01:43,390
Untertitel erstellt von c3subtitles.de
im Jahr 2018. Mach mit und hilf uns!