Starke Bilder

Wie wir sie nutzen und interpretieren

Katharina Lobinger

In: tv diskurs. Verantwortung in audiovisuellen Medien
22. Jg., 1/2018 (Ausgabe 83), S. 26-31

Die Schrift gilt allgemein als kulturell bedeutsam. Ein Jugendlicher bekommt eher Ärger, wenn er ständig Bilder und Filme auf dem Fernseher, dem Smartphone oder dem Computer nutzt, als wenn er dieselbe Zeit mit Büchern oder Zeitungen verbringt. Beim Lesen müssen Zeichen verstanden und in Wörter umgesetzt werden, der Inhalt des Bildes erklärt sich von selbst, eine besondere Kulturtechnik erscheint vielen unnötig. Um Bilder aber richtig zu verstehen und zu interpretieren, ist eine komplexe Analysefähigkeit notwendig, und die wird heute in der Gesellschaft leider noch immer unterschätzt, so Dr. Katharina Lobinger, Assistenzprofessorin für Onlinekommunikation am Institut für Communication Technologies (ITC) der Università della Svizzera italiana in Lugano. tv diskurs sprach mit ihr.

Vollständiger Beitrag als:

In der gesetzlichen Medienregulierung, so auch im Jugendschutz, geht man davon aus, dass Bilder eine unmittelbarere und damit stärkere emotionale Wirkung haben als Sprache oder Schrift.

Das ist in jedem Fall so. Manche Bilder berühren uns tief und prägen sich auch bei kurzer Betrachtungsdauer in unser Gedächtnis ein. Nicht zuletzt deshalb können wir einmal betrachtete Bilder nicht „ungesehen“ machen. Gerade im beruflichen Kontext des Jugendschutzes ist diese Wirkungsmacht von Bildern ein äußerst relevanter Aspekt. Allerdings gilt das nicht für alle Bilder. Viele Bilder machen überhaupt nicht betroffen, sie lösen auch keine emotionalen Reaktionen aus. Das sind meist Bilder, deren Inhalt uns nicht oder nur wenig interessiert. Um das Thema „Bildwirkung“ adäquat zu behandeln, muss man erst einmal differenzieren: Viele Bilder werden wir sofort vergessen und sie haben überhaupt keinen Impact. Andere dagegen können sehr starke Wirkungen haben. Bild ist also nicht gleich Bild.

Wie sieht es mit unserer Kompetenz aus, Bilder zu entschlüsseln?

Das ist ganz besonders schwierig. Wir besitzen eigentlich keine ausreichenden Bildkompetenzen, um uns kritisch mit Bildern auseinanderzusetzen. Das ist auch deshalb so, weil es in der Schule nicht explizit unterrichtet wird. Dort liegt der Fokus meist auf dem Schriftlichen oder dem Verbalen. Außerdem werden Bilder kulturell eher gering geschätzt. Wenn es sich nicht gerade um ein künstlerisch bedeutsames Bild im Museum handelt, gelten Bilder eher als banal, als weniger wichtig und weniger reflektiert – und werden der Schrift untergeordnet. Doch wir unterstellen ihnen eine besondere Macht. Als Beispiel: Es gab früher sogenannte Armenbibeln: Sie waren mit Bildern illustriert für all jene, die nicht lesen konnten. Sozusagen als simple Alternative. Das finden wir heute in vielen anderen Bereichen auch noch, wenn Bilder eingesetzt werden, um etwas zu vereinfachen und leichter verstehbar zu gestalten. Die Komplexität des Bildlichen gerät dabei leicht aus dem Fokus.

Bilder können wir mit einem Blick wahrnehmen. Wenn wir das Gleiche sprachlich beschreiben müssten, würden wir Seiten brauchen.

Ja und nein. Es stimmt, Bilder – und das ist eine ganz große Leistung – werden unfassbar schnell wahrgenommen. Ich erfasse in Bruchteilen von Sekunden, worum es in einem Bild geht. Allerdings eignet sich die Bildsprache vor allem dazu, räumliche Verhältnisse aufzuzeigen: Ich fahre mit dem Zug durch die Prärie und in der Ferne steht ein Baum. Nähe, Distanz, Anordnungen kann man bildlich viel einfacher als im Text darstellen. Bei anderen Dingen fällt es jedoch sehr schwer, sie im Bild auszudrücken. Um das Wort „Freiheit“ visuell darzustellen, muss ich diesen abstrakten, nicht gegenständlichen Begriff übersetzen. Um dann zu verstehen, wie in einem Bild „Freiheit“ suggeriert und vom Rezipienten auch wahrgenommen wird, brauche ich eben eine kritische Kompetenz. Dafür muss ich mich mit dem Bild auch ausführlicher auseinandersetzen, sowohl bei der Produktion als auch in der Rezeption.

Wir müssen für den Begriff „Freiheit“ Symbole schaffen. Die kann man wahrscheinlich leicht falsch verstehen.

Genau, daher kommt u.a. die oftmals zitierte Bedeutungsoffenheit von Bildern. Wenn es nur darum ginge, konkrete Phänomene darzustellen, dann wäre das für Bilder eine einfache Übung. Aber gerade für komplexere Zusammenhänge oder abstrakte Konzepte braucht es eine ausgefeilte Bildsprache. Gerade in der Werbung ist dies essenziell. In den 1970er- und 1980er-Jahren gab es recht viele semiotische Analysen, auch aus dem Bereich der Werbung. Eine frühe Analyse von Roland Barthes ist besonders berühmt. Sie arbeitet heraus, wie in einer Pasta- Werbung „Italianität“ suggeriert wird: Auf Produktebene wurde Pasta abgebildet, aber diese wurde mit einem besonderen Lebensgefühl beladen. Barthes konnte nachzeichnen, wie das durch ganz viele Farben, Formen, Symboliken etc. ins Bild gesetzt wurde. Daran sieht man, dass Bilder weitaus komplexere Ebenen aufweisen, denen man sich nach und nach nähern muss, wie wir es in der Analyse tun, um verstehen zu können, warum etwas für uns eben „italienisch“ aussieht. Was verbinde ich damit, was wird damit eigentlich verknüpft?

Wir haben festgestellt, dass Bilder eine sehr starke direkte, emotionale Wirkung haben. Welche Rolle spielt aber die Kognition beim Verarbeiten von Bildern und Texten?

Das ist eine sehr komplexe Frage, an der Neurowissenschaftler und Psychologen gerade forschen. Zunächst einmal: Es gibt zwei unterschiedliche Varianten, wenn wir Emotionalisierung und Bilder betrachten. Zum einen: Man kann menschliche Emotionen leicht abbilden. Ich kann einen traurigen oder weinenden Menschen darstellen – und für uns ist aufgrund der Mimik und der dargestellten Emotionen klar, was dieser Mensch fühlt oder welche Gefühle er zum Ausdruck bringt. Eine andere, etwas komplexere Variante liegt in der Emotionalisierung durch visuell-ästhetische Darstellungsmittel. Eine besondere Bildästhetik, eine besondere Nähe oder verschiedenste Techniken können bewusst eingesetzt werden. In einem Horrorfilm wird ganz klassisch mit der Farbe Rot für „Gefahr“ oder „Blut“ gearbeitet. Diese Farbsymbolik hilft uns, zu verstehen, welcher emotionale Zustand suggeriert werden soll. Die Verarbeitung ist allerdings zunächst einmal sehr subjektiv. Aber: Bilder sind besonders einprägsam. Dazu gibt es verschiedene Theorien, z.B. die sogenannte Dual-Coding-Theorie, die besagt, dass die verbale und die visuelle Vermittlungsform in unterschiedlichen Systemen, in einem sprachlichen System und in einem visuell-imaginalen System, verarbeitet werden. Forschungsergebnisse besagen, dass vor allem visuelle Eindrücke sowohl sprachlich als auch visuell gespeichert, also im Gehirn doppelt codiert werden, was dazu führt, dass man sich genauer daran erinnert oder dass die Informationen besser abgerufen werden können. Es entsteht also eine bessere Erinnerung als allein von visuellen Eindrücken. Tatsächlich gilt es aber zu beachten, dass die Verarbeitung von Bildern auch stark von ihrer Kombination mit Text, also Begleittext, Bildunterschrift etc., abhängt. Herausforderungen ergeben sich etwa dann, wenn die Aussagen von Bild und Text divergieren.

Die sogenannte Bild-Text-Schere: Wenn man keine Bilder beispielsweise von einem Terroranschlag zur Verfügung hat und sprachlich einen Vorgang schildert, in dem Menschen ums Leben gekommen sind, und im Bild nur zeigt, wie Menschen über einen komplett intakten Marktplatz laufen, dann kann natürlich auch das Bild den faktischen Eindruck des Schreckens verharmlosen.

Genau, dann ist es eine ganz schwierige Frage in der Rezeption, zu sagen, welchen Anteil das Bild an dem Eindruck hat, den ich von dem Geschehen habe und welchen Anteil der Text hat. Das kann man ganz schwer sagen – eben, weil Bild nicht gleich Bild ist. Das Schlendern über den Marktplatz ist wahrscheinlich ein Bild, das vom Betrachtenden als relativ unbedeutend interpretiert würde. Es wäre vermutlich kein „starkes“ Bild, das mit der textlichen Botschaft konkurriert, aber es erschwert in jedem Fall die Verarbeitung, weil es im Widerspruch zu der Botschaft steht, die übertragen werden soll.

Wir haben einmal einen Nachrichtenbeitrag gehabt, in dem ein alter Mann von seiner Tochter gepflegt und dabei extrem misshandelt wurde. Die Tochter hatte zur Kontrolle eine Funk-Überwachungskamera installiert, deren Signal zufällig von einem Nachbarn empfangen wurde. Die Bilder gerieten zum Sender und der verwendete sie als Hintergrund für einen Beitrag über den Pflegenotstand in Deutschland.

Ich kenne dieses Beispiel. Meine persönliche Haltung dazu korrespondiert mit dem Ergebnis, zu dem wir in einer gemeinsamen Diskussion mit anderen visuellen Forschenden gekommen sind, beruht also nicht auf einer von mir alleine durchgeführten Analyse. Was an diesem Beispiel als unerträglich beurteilt wurde, war auf der einen Seite – und das haben wir in der visuellen Kommunikation ganz oft – die Motivebene, also was gezeigt wird. Auf der anderen Seite war die Darstellungsebene, also wie es gezeigt wird. Darf man zeigen, wie dieser Mann misshandelt wird, weil seine Menschenwürde dadurch verletzt wird? Der Beitrag wiederholt diesen Akt, teilweise in Zeitlupe, und die physische und psychische Gewalt einige Male, um genügend Bilder für den Text zu erhalten. Das sollte man nicht tun. Dagegen steht das berechtigte Interesse einer Öffentlichkeit, von diesen schrecklichen Ereignissen zu erfahren. Insofern ist es gerechtfertigt, die aufgenommene Misshandlung kurz zu zeigen. Das ist aber eine ganz schwierige Gratwanderung. Wir haben die gewählte Darstellungsform als unangemessen angesehen, denn man sah die Szene der tatsächlichen Gewalthandlung vier Mal – und da fragt man sich wirklich, ob diese Emotionalisierung und Wiederholung berechtigt sind. Das Ganze erhielt vor allem durch die Art und Weise der visuellen Darstellung – durch das „Wie“ – einen stark voyeuristischen Charakter.

Durch zu starke emotionalisierende Darstellungen kann so etwas wie Reaktanz entstehen: Die Emotionen und das dadurch hervorgerufene Mitleid kann der Zuschauer nicht mehr aushalten.

Da müsste man noch einmal unterschiedliche Ergebnisse aus der Forschung zusammenziehen und kontrastieren. Aber es gibt durchaus Belege, die sagen: Emotionalisierung als Erregungsniveau erhöht unsere Aufmerksamkeit für Inhalte und hilft uns auch dabei, die dargebotenen Informationen zu verarbeiten und leichter zu erinnern – bis zu einem gewissen Grad. Dann funktioniert genau das nicht mehr. Diese Grenze ist aber schwer festzulegen. Bei Bildern aus Kriegen hat man beobachtet, dass die Stärke der angsterzeugenden Stimuli eine Art Blackout erzeugt, dass man also so schockiert ist von dem, was man sieht, dass man gar keine Möglichkeit der Verarbeitung mehr hat. Die Medien befinden sich sehr oft in dem Dilemma, dass sie ein gewisses Aufmerksamkeits- und Erregungsniveau schaffen müssen, um im Kampf mit so vielen anderen Bildern und Informationen die nötige Aufmerksamkeit zu erzeugen. Wenn es aber zu viel wird, dann funktioniert die Vermittlung zentraler Inhalte eben nicht mehr.

Wäre es möglich, dass die Medien auf Dauer unsere Fähigkeit zu Empathie verstärken, dass z.B. dadurch, dass man Bilder von Schlachthöfen oder Massentierhaltung zeigt, die Zahl von Vegetariern und Tieraktivisten zunimmt? Oder könnte angesichts der Inflation von Bildern eher eine Abstumpfung der Emotionen entstehen?

Jeder bringt individuelle Präferenzen mit. Wenn ich per se ein sehr starkes Mitgefühl mit Tieren habe und nicht möchte, dass diese leiden und geschlachtet werden, dann wird mich so ein Beitrag vermutlich ganz anders berühren, als wenn ich überzeugt bin, krank zu werden, wenn ich nicht mindestens einmal am Tag ein blutiges Steak esse. Wir versuchen oft, Medienwirkung als das einfache Stimulus-Response-Modell zu denken – das funktioniert aber nicht. Der Rezipient eignet sich die Inhalte an und gleicht sie mit dem eigenen Erfahrungshorizont ab. Das führt dazu, dass bestimmte Medien bei bestimmten Gruppen stärkere oder schwächere Wirkungen erzeugen. In jedem Fall – und hier ist auch der Wiederholungsaspekt wichtig – sollte man bei sensiblen Themen nicht meinen, dass man immer krasser berichten und immer stärkere Bilder bringen muss, um die Menschen noch aufzurütteln, nur aus der Annahme heraus, dass sie sonst abstumpfen. Denn auf der anderen Seite gibt es auch die These, dass wiederholte Rezeption z.B. traumatisieren kann. Es gibt zwei Thesen in unterschiedliche Richtungen: Die wiederholte Rezeption stark emotionalisierender Inhalte führt dazu, dass ich vielleicht als Rezipient traumatisiert werde, vor allem in der Kriegsberichterstattung. Die andere These besagt, dass es zur Abstumpfung kommt. Deswegen muss man in der Nachrichtenproduktion im Einzelfall sehr genau überlegen, wie man einen entsprechenden Beitrag aufbereitet, wie die Erzählung einer audiovisuellen Geschichte am besten aufgebaut werden kann, um die beabsichtigte Botschaft zu vermitteln. Oft ist auch ein dezenteres Bild besser geeignet, eine Geschichte zu erzählen. Man kann nie das Bild allein betrachten, man muss es im Kontext sehen.

Wenn im Geschichts- oder Sozialkundeunterricht über die NS-Zeit gesprochen wird und Bilder aus Konzentrationslagern gezeigt werden, gibt es da nicht auch einen Punkt, an dem das nicht mehr zu verkraften ist?

Ich habe Bilder und Filme aus der NS-Zeit, die ich nie vergessen werde, während meiner Studienzeit gesehen. Das ist ein Beispiel für Bilder, die ich nicht „ungesehen“ machen kann. Wir wurden auf die Rezeption jedoch entsprechend vorbereitet, um dann auch verstehen zu können, was diese Bilder bedeuten. Wir hatten auch die Möglichkeit, Pausen einzufordern oder zu sagen: Das ist uns an dieser Stelle zu viel. Ein sensibler Umgang mit solchen Bildern ist sehr wichtig. Es zeigt sich auch, dass manche Studierenden zarter und andere weniger zart besaitet waren. Das soll keine normative Wertung sein. Es gibt keine „richtige“ Rüstung gegen emotionale Bildwirkungen. Vielmehr zeigt das Beispiel, dass Menschen sehr individuell mit solch schrecklichen Bildern umgehen, abhängig auch vom Vorwissen oder der eigenen Biografie. Bilder haben zwar oftmals eine starke Wirkung, aber sie sprechen eben nicht für sich, sie müssen im Kontext gesehen werden; und wenn ich den Kontext der Produktion und den zeitlichen Kontext nicht verstehe, dann kann ich auch die aktuelle Bedeutung nicht entsprechend einschätzen. Man darf auch nicht vergessen, dass junge Zuschauer wissen: Diese Bilder sind nicht fiktional, sie zeigen die „Wirklichkeit“. Interessanterweise wird oftmals nicht berücksichtigt, dass man vieles auch in anderen visuellen Formen kommunizieren kann. Kennen Sie den Comic Maus. Die Geschichte eines Überlebenden von Art Spiegelman, der die NS-Zeit thematisiert? Es sind keine Fotografien, sondern gezeichnete Comic-Panels, welche die Geschichten der NS-Zeit erzählen und total berührend sind. Sie regen ebenfalls zum Nachdenken an, relativieren aber ein bisschen die stark emotionalisierende Wirkung des Visuellen, indem eben keine Fotografien gezeigt werden. Auch solche Alternativen können durchaus in Betracht gezogen werden.

Hat die Inflation der Bilder möglicherweise eine Veränderung oder gar einen Verlust der kognitiven Fähigkeiten zur Folge?

Ich denke nicht. Ich kenne dafür keine empirischen Belege. Das ist aber auch etwas, das sich ganz schwer untersuchen lässt. Ich bin davon überzeugt, dass Emotion nicht das Gegenteil von Information ist. Natürlich werden Nachrichten heute anders aufbereitet, weil sie stärker visuell dominiert sind. Wir haben deshalb auch eine andere Erwartungshaltung daran, wie uns Nachrichten präsentiert werden. In den sozialen Medien oder in der Werbung werden wir andere Kontexte erwarten. Daraus einen Rückschluss auf unsere Kognitionsfähigkeiten zu ziehen, geht mir schon sehr weit. Ich glaube nicht, dass da relativ kurzfristige Medieninnovationen einen so starken Einfluss auf unsere kognitiven Fähigkeiten besitzen. Ich gehe auch nicht konform mit Annahmen, die sagen: Bilder machen uns dümmer – oder dass wir den Orientierungssinn verlieren, weil wir Navis verwenden. Die Frage wäre eher: Wie kann ich Bilder, die ich für bestimmte gesellschaftlich wünschenswerte Zwecke einsetze, gestalten? Wie kann ich Kinder und Jugendliche dazu bringen, sich mit diesen Inhalten adäquat auseinanderzusetzen? Gehe ich davon aus, dass Bilder zur Verdummung führen und durch die emotionale Wahrnehmung die Kognition abnimmt, dann habe ich per se nur die Handhabe zu sagen: Gut, dann gibt es eben keine Bilder mehr. Und das ist völlig unrealistisch. Wir sollten vielmehr in einem produktiveren Zugang dafür sorgen, dass Heranwachsende die entsprechenden Handlungsanleitungen erwerben und im Umgang mit Bildern geschult werden, um sie zu kompetenten Nutzern der gegenwärtigen Medienumgebungen zu machen. Das bedeutet nicht, dass wir bestimmte Dinge und Verstöße einfach hinnehmen sollten, aber ich denke, dass erst die entsprechende kritische Kompetenz die Voraussetzung dafür ist, etwas kritisieren zu können, was gesellschaftlich vielleicht nicht wünschenswert ist.

Dass wir Telefonnummern vergessen, weil wir sie im Telefon speichern können, dass wir keine Karten mehr lesen können, seitdem es das Navi gibt, ist unbestritten. Aber das schafft ja auch neue Kapazitäten.

Hinter der Frage steckt die Vermutung, ein Bild sei etwas dem Text Untergeordnetes, und ein weniger rationaler Zugang bedeute weniger Kognition. Sie haben gesagt, meine Telefonnummern merke ich mir nicht mehr, die vergesse ich. Völlig richtig, aber ich muss mir im Leben auch nicht alles merken. Die Frage ist immer: Was wird als bedeutsam gesehen, was muss ich wissen, was muss ich mir für welche Kontexte merken? Das bedeutet aber nicht automatisch, dass meine Kognitionsfähigkeit abnimmt. Da gibt es noch einen zweiten Punkt: Weil wir in einer neoliberalen Gesellschaft leben, müssen wir Experten in einem sehr kleinen Bereich sein – ob jetzt im Allgemeinen oder im akademischen Leben. Was für die Karriere und den beruflichen oder privaten Erfolg nichts bringt, ist nicht so wichtig. Man spricht davon, dass wir alle zu Unternehmern des eigenen Selbst werden und damit selbst – und quasi alleine – verantwortlich für unsere Selbstvermarktung (ähnlich wie bei einem Produkt), unsere Karrieren und unsere erfolgreichen Lebensentwürfe sind. Gleichzeitig steht dem aber immer noch der gesellschaftliche Vorwurf gegenüber, Kinder und Jugendliche verfügten über keine Allgemeinbildung mehr. Beides kann aber niemand erfüllen. Wenn man kritisiert, durch das Navi könnten Kinder keine Karten mehr lesen, würde ich der vorherigen Generation außerdem die Frage stellen, ob sie noch mithilfe der Orientierung an den Sternen über den Ozean segeln könnten. Die Orientierung an Sternen war ein Orientierungssystem vor GPS und Karten. Daran sieht man sehr schnell, dass aktuelle Entwicklungen vermeintlich immer etwas Bedrohlicheres haben, was mit einem Verlust gewisser Bereiche einhergeht.

Wenn man sich mit 16-Jährigen unterhält, hat man als Erwachsener das Gefühl, die Handys seien an der Hand der Jugendlichen festgewachsen.

Gerade, wenn neue Medien aufkommen, sind es meistens die Jugendlichen, die sie zuerst verwenden. Dann gibt es noch keine Regeln über den kulturellen und gesellschaftlichen Gebrauch dieser Geräte. Ist es jetzt in Ordnung, dass mein Neffe, während ich mit ihm spreche, nur auf sein Handy schaut? Aus seiner Sicht macht er vielleicht etwas Produktives oder ist in Kontakt mit Freunden. Ich sehe ja nur das Handy, er aber sieht den Kontakt zu seiner ganz zentralen Peergroup. Das ist ja per se nichts Schlechtes. Es wird erst dann zu etwas sozial Unerwünschtem, wenn man sich nicht auf gemeinsame Regeln verständigen kann. Wenn ich mit meinem Neffen spreche und ihm sage, dass ich seinen Handygebrauch nicht schön finde, weil ich mich mit ihm unterhalten möchte und für seine volle Aufmerksamkeit dankbar wäre, erfolgt eine Verständigung über Regeln. Dann muss ich mir aber auch anhören, was er dazu zu sagen hat. Und das ist etwas, was wir aktuell ganz massiv sehen in Bezug auf Foto-Sharing, in Bezug auf Alltagskommunikation in mediatisierter Form: Es gibt kein Regelwerk, das besagt, was richtig und was falsch ist. Und unsere gesellschaftlichen Regeln hinken hinter den medialen und technischen Innovationen hinterher. In Lehrveranstaltungen präsentiere ich gerne Bilder, die zeigen, wie in der U-Bahn Menschen nebeneinandersitzen, die nicht miteinander reden, sondern alle auf ihre Smartphones starren. Ich bin noch in einer Zeit aufgewachsen, in der ich Zug oder Straßenbahn gefahren bin und kein Handy dabeihatte. Es wäre sehr komisch gewesen, wenn ich damals wahllos Menschen angesprochen hätte, um mich mit irgendjemandem zu unterhalten. Es gibt soziale Konventionen, sie besagen, dass man Menschen, die man nicht kennt, nicht ohne Weiteres anspricht. Früher saßen die Leute eben mit Zeitungen in der U-Bahn, was heute wieder wünschenswert wäre, weil es darauf hindeuten würde, dass Nachrichten gelesen werden etc. Was wir aber auch sehen müssen: Wenn jemand in der U-Bahn auf seinen Screen starrt, dann kommuniziert er vielleicht gerade mit einem guten Freund, dem Partner oder den Eltern. Das sehen wir nicht. Wir sehen immer nur die kalte Technik, die vermeintlich soziale Beziehungen unterbindet.

Dr. Katharina Lobinger ist Assistenzprofessorin für Onlinekommunikation am Institut für Communication Technologies (ITC) der Università della Svizzera italiana in Lugano.

Prof. Joachim von Gottberg ist Geschäftsführer der Freiwilligen Selbstkontrolle Fernsehen (FSF) und Chefredakteur der Fachzeitschrft tv diskurs.