Zur Inszenierung von kritischen Kompetenzen in Nischenöffentlichkeiten

Bewertungen von Smart Speakern auf YouTube

  • David Waldecker ORCID logo Universität Siegen
  • Dagmar Hoffmann ORCID logo Universität Siegen

DOI:

https://doi.org/10.15460/kommges.2022.23.1.1000

Schlagworte:

Datenschutz, Konsumtechnik, Review-Videos, Smart Speaker, Unboxing, Warentest, Öffentlichkeit

Redaktion und Begutachtung

  • Nils Zurawski ORCID logo Universität Hamburg
  • Lina Franken ORCID logo Universität Vechta

Abstract

Der vorliegende Beitrag widmet sich der Analyse von Unboxing- und Review-Videos auf der Plattform YouTube, die sich vornehmlich mit dem Testen von Konsumtechnik beschäftigen. Die Videos zeigen das Auspacken und das Ausprobieren von Produkten, die Begutachtung ihrer Funktions- und Gebrauchsweisen und die Überprüfung ihrer Gebrauchsversprechen. Die Tests führen keine formal qualifizierten Warentester:innen durch, sondern in der Regel Nutzer:innen, die sich darauf spezialisiert haben. Unboxing- und Review-Videos können insofern als Element der Selbstinszenierung und -vermarktung von (pseudo-)privaten Praktiken des Auspackens und des Bewertens verstanden werden. Im Folgenden interessieren wir uns für das Testen und Bewerten von Smart Speakern, die im häuslichen Bereich zum Einsatz kommen. Im Sinne einer Sociology of Conventions and Testing (Potthast, 2017) wird anhand eines Fallvergleichs auf inhaltlicher Ebene danach gefragt, welche Aspekte der Geräte angesprochen werden, und auf ästhetischer Ebene, wie das Testen der Geräte von den YouTuber:innen inszeniert und in die Logik der Videoplattform eingebettet wird. Zugleich wird die Performanz der Produzierenden und ihrer kritischen Kompetenz untersucht. Der Beitrag stellt zudem dar, inwieweit Nutzungsbedingungen und insbesondere etwaige Datenschutzproblematiken, wie sie im öffentlichen Diskurs zumeist kritisch verhandelt und zuweilen auch in Werbespots thematisiert werden, in den Reviews zwischen einer Kritik und der Anpreisung der Produkte aufgegriffen werden.

1 Einleitung

Die Produktion und Rezeption von Online-Videos, vor allem über die Plattform YouTube, ist ein fester Bestandteil populärer Medienpraktiken. YouTube dient vielen als kostenlose Quelle für Unterhaltung wie Musik- und Sportvideos sowie Nachrichten. Aber auch genuin im Web entstandene Videoformate wie Let’s Play, ASMR oder Mok-Bang haben sich als Teil der Populärkultur etabliert. Dieser Beitrag untersucht das Phänomen der Unboxing- und Review-Videos, die ebenfalls als Web-Videoformat entstanden sind. Wir konzentrieren uns hier auf die Besprechung von Smart Speakern auf YouTube und fragen sowohl nach der Inszenierung der YouTuber:innen und der zu testenden Geräte als auch nach den Bewertungskriterien der Produktkritiken in diesen Videos, insbesondere in Hinblick auf kommerzielle Datenpraktiken.

Unboxing- und Review-Videos sind eine Variante von Videoformaten, die sich dem Auspacken und Bewerten von Konsumartikeln widmen. Während sogenannte Haul-Videos in diesem Sinn vor allem Kosmetik und Modeartikel diskutieren, sind es bei Unboxing-Videos primär Digitaltechnik wie Smartphones, Laptops oder Smart-Watches. Sie sind jedoch mehr als nur Produktberatung oder Social-Media-Entertainment (vgl. beispielsweise Craig & Cunningham, 2017, S. 78), sondern auch als ein Element von Öffentlichkeit zu verstehen. Sie greifen die Diskussion und Bewertung von technischen Artefakten und Diensten auf, die on- und offline in der Fach- und Publikumspresse – in Zeitschriften und Angeboten wie Technology Review, Stiftung Warentest und golem.de – geführt werden und werten sie durch das Video-Format narrativ und ästhetisch auf. Auf diese Weise sind sie zugleich in Konsumpraktiken wie den öffentlichen Diskurs über diese eingebunden.

Diese neue Form der Ver-Öffentlichung von zuvor lediglich privaten Bewertungen kann als eine Ermächtigung von Techniknutzenden verstanden werden. Die Videos verweisen des Weiteren auf die Entstehung einer neuen Sozialfigur (Moser & Schlechtriemen, 2018), die als YouTuber:in, Influencer:in oder Vlogger:in im Social-Media-Entertainment als Self-Made-Analogon zum Star des Studiokino-Systems fungiert. Sie gerät zunächst als Privatperson in die Öffentlichkeit und macht häufig den eigenen Alltag zum Thema ihrer Videos. Diese Sozialfiguren werden in der weiteren Öffentlichkeit wiederum als Produzierende von niveauloser Nabelschau, als gefährdender Einfluss auf Jüngere und als Träger von Schleichwerbung kritisiert (u.a. Fries, 2018, S. 75). In diesem Beitrag wollen wir diese Gemengelage von Medienformaten, Privatheit und Öffentlichkeit, Bewertung und Kritik an einer relativ neuen Medien- und Konsumtechnik diskutieren: der Bewertung von Smart Speakern und den zugehörigen Intelligenten Persönlichen Assistenten (IPAs) wie Amazon Echo mit Alexa, Google Nest und dem Google Assistant sowie Apples HomePod mit Siri. Diese Geräte werden sowohl im öffentlichen Diskurs als auch in der sozial- und medienwissenschaftlichen Diskussion als neueste Instanz eines „Überwachungskapitalismus“ (Zuboff, 2018) oder einer „Kolonialisierung“ des Alltags durch Internetkonzerne (Couldry & Mejias, 2019) verstanden. Sie stehen damit ebenso unter kritischer Beobachtung wie die YouTuber:innen (Nyomen & Schmitt, 2021), die sich mit ihnen öffentlich beschäftigen. Es stellt sich also die Frage, inwiefern die in den herkömmlichen Leitmedien (Reichelt & Hegemann, 2019), der politischen Bildung (Zuboff, 2019) und auch in Parlamenten geführte Debatte um die Risiken der Datenverwertung durch digitale Plattformen, insbesondere in der Auswertung von gesprochener Sprache (Turow, 2021), in der durch die YouTube-Videos erzeugten Öffentlichkeit thematisiert wird.

Dabei konzentrieren wir uns in unserem Beitrag weniger darauf, wer solche Videos aus welchen Motiven rezipiert, sondern vor allem auf die Darstellung und Besprechung der Smart Speaker durch reichweitenstarke Tech-YouTuber:innen. Mit Bezug auf die Soziologie der Bewertung, den Strukturwandel und die Hybridisierung von Öffentlichkeit(en) fragen wir uns: In welcher spezifischen Rolle agieren die YouTuber:innen auf der Plattform und inwieweit präsentieren sie sich als ermächtigt, Bewertungen der Geräte vorzunehmen? Wie gehen die YouTuber:innen mit den Diskussionen um die Problematik der auditiven Kontrolle und Überwachung des privaten Wohnraums im Kontext der Smart-Speaker-Nutzung um? Uns interessieren in diesem Zusammenhang in ästhetisch-dramaturgischer Hinsicht sowohl die (Selbst-)Inszenierungen der (vermeintlichen) Expert:innen als auch die der Geräte.

Unser Beitrag ist wie folgt gegliedert: Nach einer Darstellung der Forschungsliteratur zu Unboxing- und Review-Videos, zu YouTuber:innen und Öffentlichkeiten einerseits und der Diskussion um die Datenpraktiken der Smart-Speaker-Nutzung andererseits (Abschnitt 2), sowie der Vorstellung unseres Samples und des methodischen Vorgehens (3) erläutern wir fallvergleichend, wie zwei in diesem Segment etablierte YouTuber sich, die Smart Speaker, ihre häusliche Medienaneignung und nicht zuletzt ihre Bewertungskompetenz präsentieren (4). Abschließend diskutieren wir die Ergebnisse und die Konsequenzen für weitere Forschung (5).

2 Akteure und Formate von Bewertungsvideos auf YouTube

2.1 Unboxing- und Review-Videos als Genres

Unboxing- und Review-Videos sind als Genres erst unter Online-Bedingungen entstanden. Als eines der ersten gilt ein Video einer Technikzeitschrift, welches das Entpacken eines Nokia-Handys zeigt (Unbox.IT, 2006). Die Videos greifen in produktionsästhetischer Hinsicht gleichwohl auf verschiedene Film- und Fernsehkonventionen zurück, welche sie in der Präsentation der Konsumtechnik und der Testenden in eine neue Konstellation bringen. Indem die Videos selbst anhand von Klickzahlen gerankt und durch Kommentare und Likes bewertet werden, sind sie Teil dessen, was in der neueren Soziologie der Bewertung und des Testens (Potthast, 2017) als Ubiquität von Bewertung im Digitalen angesehen wird (Kropf & Laser, 2019). Sie sind aber zugleich als Zeugnis der Verankerung dieser digitalen Bewertungskulturen in herkömmlichen kulturellen Formen zu verstehen, die hier zugleich auf YouTube plattformisiert auftreten (Gillespie, 2010) und sich mit der Besprechung von Smart Speakern einem plattformisierten Thema (Pridmore et al., 2019) widmen, da die Smart Speaker, die zugehörige automatische Sprachverarbeitung und die Verknüpfung mit anderen Smart-Home-Geräten jeweils komplett von einem Anbieter zur Verfügung gestellt werden.

Unboxing-Videos verwenden laut Sharif Mowlabocus (2020, S. 566) sowohl Inszenierungselemente aus Koch-, Garten- und Wissenschaftssendungen, aber auch der kommerziellen (ebd., S. 567) sowie Amateurpornographie (ebd., S. 573): „Unboxing videos cannot function without the act of unboxing and, as with pornography, this act speaks to our desire to witness the crossing of a boundary, seeing something for the first time.“ (ebd., S. 567) Des Weiteren werden in der Präsentation der Artefakte Inszenierungstechniken aus dem Tele-Shopping aufgegriffen, um die Haptik der Geräte zu visualisieren: “[R]emote shopping has long relied heavily on close-up shots of hands holding, caressing and modelling all manner of items, as the camera moves slowly over the surfaces of the object” (ebd., S. 574). Die von Mowlabocus erwähnten Analogien machen deutlich, dass die Inszenierung bewusst auf den haptischen Umgang mit einem neuen Gerät und auf dessen Ästhetik fokussiert.

Review-Videos verfolgen ästhetisch ähnliche Strategien, beschränken sich aber meist nicht auf einen ersten Eindruck eines Geräts, sondern ziehen nach einer Weile der Nutzung Bilanz oder testen die bereits installierten bzw. in Betrieb genommenen Geräte oder Gegenstände vor der Kamera. Neben den Nahaufnahmen der Geräte greifen beide Formate ebenfalls das Testimonial aus dem Tele-Shopping und Werbe-Clips auf – das persönliche Bekenntnis einer prominenten oder scheinbar spontan auf der Straße befragten Person bezüglich eines Themas oder einer Ware. Daher rückt nicht nur das besprochene Gerät, sondern auch die Person, welche das Gerät entpackt und bewertet, in den Vordergrund. Um Vertrauen aufzubauen, werden von den Rezensent:innen nicht nur die Produkte beschrieben, sondern die Akteur:innen werden in vielen Videos auch bei der Verwendung des Produkts gezeigt.1

Die Videos stehen dabei nicht für sich, sondern verweisen in vielerlei Hinsicht auf den Kontext der Videos. So produzieren YouTuber:innen meist in regelmäßigen Abständen neue Videos und veröffentlichen diese auf ihrem YouTube-Kanal, der in gewisser Weise mit den Konten in anderen Social-Media-Plattformen vergleichbar ist. Ebenso wie bei etwa Instagram werden neben einem spezifischen Namen bei der Kanal-Ansicht auf YouTube auch die Anzahl der Abonnierenden und die Anzahl der Beiträge angezeigt. Damit können die Videos einer Person zugeordnet werden und auch dem Publikum, das Kanäle abonnieren kann, besser nähergebracht werden. Durch die Kanäle, vor allem aber durch die mehr oder weniger regelmäßigen Veröffentlichungen sind die Videos in eine Serialität eingebettet, die in den Videos auch durch kanalspezifische Gestaltung wie Jingles, Animationen, Logos und durch die Moderation durch die gleiche YouTuber:in verstärkt wird. Zugleich lässt sich bei vielen der populäreren Kanäle eine thematische Engführung auf eine Produktkategorie oder sogar Produkte einer bestimmten Firma beobachten. In den Videos selbst wiederum wird häufig auf die Kanäle und deren Abonniermöglichkeit und auf weitere Videos aus dem Kanal verwiesen. Wie wir weiter unten ausführen, verbinden die Videos auf diese Weise Elemente der Serialität, die aus dem Fernsehen bekannt sind, mit jenen von Social-Media-Plattformen, zu denen unter anderem die Personalisierung zählt.

2.2 YouTuber:innen als nahbare Produzierende von Öffentlichkeit

Unboxing- und Review-Videos können in einen Kontext von „Lifestyle-Videos“ (Geimer, 2018, S. 7) gestellt werden, da sie immer auch die Filmenden selbst inszenieren. Wie Craig & Cunningham (2017, S. 78) deutlich machen, werden diese Videos von „rapidly professionalising-amateur content creators“ hergestellt, die daran arbeiten, ihren YouTube-Kanal in eine „own media brand“ zu verwandeln. Diese Professionalisierung zielt über die ästhetische Aufwertung der Videos, die bei den erfolgreichen Kanälen kaum noch Amateurhaftes an sich haben, darauf ab, die YouTuber:innen selbst als interessant erscheinen zu lassen. Diese „creator labour“ (ebd., S. 82) haben Craig und Cunningham in ihrer Studie im Blick, wenn sie die Betreiber:innen von (erfolgreichen) Kanälen für Spielzeug-Unboxing interviewen. In den Interviews wird deutlich, dass die YouTuber:innen sich dabei „discourses of authenticity and community“ (ebd., S. 84) verpflichtet fühlen und nicht auf jedes Kooperationsangebot von Produktherstellenden eingehen. Der Werbeeffekt für die entsprechenden Produkte und der etwaige monetäre Zugewinn, der nicht immer konkret durch die YouTuber:innen angegeben wird, werden dabei von den YouTuber:innen letztlich mit dem Effekt dieser Produktbesprechung auf das öffentliche Bild der Person in Beziehung gesetzt. Indirekte Werbung für Produkte wird also gegenüber der Werbung für den eigenen Kanal, als welche sich jedes Video wiederum erweist, abgewogen.

Auch Wagner & Forytarczyk (2015, S. 10) erwähnen in ihrer Studie über die Produzent:innen von Haul-Videos die Zusammenarbeit mit „Firmen zu Marketingzwecken“ und die oben beschriebenen Strategien, „trotz dieser marketingförmigen Praxis authentisch zu bleiben“. Die „creator labour“ besteht nicht nur in dem Umgang mit etwaigen Sponsor:innen und Finanziers. Ganz grundsätzlich müssen YouTuber:innen als Ausführende – in einer Person zuständig für Darstellung, Kamera, Ton, Regie und Schnitt – viele ästhetisch und dramaturgisch bedeutsame Entscheidungen treffen, die bei herkömmlichen Produktionsfirmen auf mehreren Schultern verteilt sind. Die von den Autorinnen diskutierten Inszenierungspraktiken von Haul-Videos sind so auch für die Analyse von Unboxing-Videos relevant. Die von ihnen interviewten YouTuberinnen machen deutlich, dass sie sich an anderen Videos orientieren und dabei „[g]ute Kopien” erzeugen. Obwohl sie also vielfach gestalterische Mittel anderer übernehmen, zeigen sie sich gleichwohl als „selbstbewusste Sprecherinnen“ (ebd., S. 8), indem sie darüber reflektieren, wie und mit Bezug auf welche ästhetischen Strategien sie sich einer Öffentlichkeit gegenüber darstellen. Dabei wird laut Wagner & Forytarczyk (2015, S. 18) eine „Nischen-Öffentlichkeit“ adressiert. Es geht den YouTuber:innen also nicht um eine deliberative Öffentlichkeit im Sinne von Habermas (1990), in welcher Argumente über gesellschaftliche Probleme ausgetauscht werden; vielmehr werden gezielt Gleichgesinnte adressiert, die sich jeweils beispielsweise für Kosmetik, Konsumtechnik oder Spielzeug interessieren. Bei der Zuordnung des Publikums spielen nicht nur die in den Sozialen Medien verwendeten Sortier- und Empfehlungsmechanismen eine Rolle; die YouTuber:innen und ihr Publikum achten laut Wagner & Forytarczyk (2015, S. 11f.) selbst darauf, dass negative Kommentare zu den Videos ausgeblendet oder gelöscht werden. Diese Form von personalisierter Öffentlichkeit, die sich von vornherein nur an Interessierte richtet und diese regelmäßig mit sich formal und inhaltlich ähnelnden Videos bedient, erzeugt somit immer auch Aufmerksamkeit für die produzierende Person.

Aus einer Perspektive der Soziologie der Bewertung im Sinne Boltanski & Thévenot (2007) finden sich damit die YouTuber:innen in der Rechtfertigungsordnung der partizipativen Ökonomie der Aufmerksamkeit, aber auch der marktförmigen Ökonomie der Aufmerksamkeit, wie sie Kessous (2015) analysiert hat. Während in Kessousʼ Darstellung die partizipative Form durch die Nutzenden der Plattformen und die marktförmige durch die Betreibenden der Plattform Verwendung finden, sind in den Praktiken der YouTuber:innen beide Formen im Gebrauch. Denn zum einen zeigen sich die YouTuber:innen ihrer Community verpflichtet; zugleich versuchen sie aber auch, die ihnen geschenkte Aufmerksamkeit zu monetarisieren, indem sie etwa auf Affiliate-Links verweisen, über die sie beim Kauf von Produkten Provision beziehen (Frühbrodt & Floren, 2019). Während in den Videos nicht immer offengelegt wird, ob die YouTuber:innen das besprochene Produkt selbst gekauft oder durch Firmen zur Verfügung gestellt bekommen haben, gehen YouTuber:innen in ihren Videos teils explizit darauf ein, dass sie mit den Videos ihren Lebensunterhalt finanzieren wollen. Dies ist aus der Art der Inszenierung, in der die ‚ganze’ Person thematisiert wird, verständlich, sorgt aber zugleich für Transparenz. Diese wird auch in Bezug auf die Produktion der Videos gepflegt, da einige YouTuber:innen in Videos erklären, mit welchen Geräten, welcher Software und welchen Verfahren sie die Videos produzieren. Die YouTuber:innen geben dem Publikum auf diesem Weg Hinweise, wie sie selbst gegebenenfalls solche Videos anfertigen können. Dadurch wird trotz der durch die YouTuber:innen verfolgten Professionalisierung die relative Nähe von YouTuber:innen und Zuschauer:innen betont.

Dass Gleichgesinnte in einem egalitären Sinn adressiert werden, zeigt sich am direkten Agieren der YouTuber:innen mit einer nicht näher benannten Person durch die Kamera. Der Zuschauer/die Zuschauerin wird unmittelbar in das Geschehen eingebunden. Diese Sprecherfigur hat Stephen J. Neville (2021) in Anlehnung an Maria Bakardjieva (2005, S. 98f.) als jene des „online warm expert“ beschrieben. Bakardijeva beschreibt mit dem Begriff des „warm expert“ jene Personen, die von Techniknutzenden wegen ihrer größeren technischen Erfahrung und der direkten Bekanntschaft um Rat gefragt werden. Sie hat die Aneignungsprozesse von digital-vernetzter Medientechnik aus der Perspektive der Domestizierungsforschung untersucht und dabei herausgestellt, dass die Aneignung nicht nur im Haushalt – dem klassischen Topos der Domestizierungstheorie (vgl. Silverstone, Hirsch & Morley, 1992) – sondern ebenfalls durch das persönliche Umfeld des Haushalts vermittelt ist. Den „warm experts“ wird nicht Vertrauen entgegengebracht, weil sie durch eine Berufsausbildung qualifizierte Aussagen treffen können, sondern weil sie schlicht einen Wissensvorsprung im Umgang mit den jeweils interessierenden technischen Artefakten und Diensten haben. Es ist dieses praktische Wissen gepaart mit der Erreichbarkeit, welche die „warm experts“ für die potentiellen Nutzenden interessant machen (Bakardjieva, 2005). Die „online warm experts“ fungieren nun über die Plattform YouTube als eine digitale Form dieser Bekanntschaften, die in verständlicher Sprache über Einsatzmöglichkeiten und Bedienkonzepte von digitaler Konsumtechnik sprechen, Kaufempfehlungen abgeben und des Weiteren über die Kommentarfunktion bei YouTube und über weitere Social-Media-Kanäle auch für Fragen zur Verfügung stehen (Neville, 2021). Daher, so unsere Überlegung, steht in diesen Videos der unmittelbare Gebrauch der Geräte im Vordergrund. Prüfkriterien, wie man sie aus institutionalisierten, unabhängigen Warentests kennt (Primus, 2017), technische Details und Prozesse werden eher selten erläutert, weil sie aus der Sicht der Konsument:innen – und um solche handelt es sich bei den „online warm experts“ ebenso – nicht unmittelbar verfügbar sind und vielfach für den alltäglichen Gebrauch auch nicht als bekannt vorausgesetzt werden müssen.

2.3 Handhabung und Datenschutz als Testkriterien

Die soeben beschriebenen Logiken der Bewertung werden laut Neville (2021, S. 1293) jedoch zum Problem, wenn es in den Videos, wie im Fall von Smart Speakern, um Digitaltechnik geht, die in die extensive Auswertung von Nutzungsdaten eingebunden ist. Folglich zeigt seine Analyse von Unboxing-Videos von Amazon-Echo-Geräten, dass Datenschutz und Schutz der Privatsphäre in diesen Videos kaum Berücksichtigung finden (ebd., S. 1302). Dieser Befund ist insofern interessant, als die Debatte um diese Ausnutzung von Nutzungsdaten nicht nur in der Wissenschaft (vgl. etwa Srnicek, 2018), sondern auch in der breiteren Öffentlichkeit geführt wird (Turow, 2021). Smart Speaker werden etwa von Zuboff als Speerspitze einer Verwertung des „Verhaltensüberschusses“ (Zuboff, 2018, S. 97) gedeutet, da sie ein Abschöpfen nicht nur von Online-Nutzungsdaten wie etwa durch Google, oder Verkaufsdaten wie etwa durch Amazon, sondern auch von häuslichen Alltagspraktiken erlauben (ebd. S. 297). Neben dieser Verwertung von Nutzungsdaten für die Erstellung von Kundenprofilen für die Plattformen der drei großen Anbieter Amazon (vgl. West, 2022), Google und Apple, werden die anfallenden Sprachdaten jedoch auch für das Training der automatischen Spracherkennung verwendet, wobei diese Spracherkennung von den Anbietern wiederum im Call-Center-Bereich vermarktet wird (Waldecker & Volmar, 2022, S. 175). Mit Bezug auf diese Debatte entscheiden sich nicht wenige gegen die Anschaffung eines Smart Speakers (Lau, Zimmerman & Schaub, 2018).

In Nevilles Darstellung gerät die Verantwortung der YouTuber:innen in den Blick, sich zu solchen Datenpraktiken zu verhalten. Zu grundsätzlicher Kritik an der Technik und insbesondere der Datenauswertung durch Anbietende und Dritte sind die YouTuber:innen laut Neville (2021) nicht fähig, weil sie in ihren Videos die Technik als grundsätzlich begehrenswert darstellen. Während einzelne Aspekte der Geräte kritisiert werden, steht die Sinnhaftigkeit der Nutzung solcher digitaler Assistenten in den Videos außer Frage. Neville (2021, S. 1293) bezieht sich in diesem Zusammenhang auf Pinelopi Troullinous Begriff der „seductive surveillance“ (vgl. Troullinou, 2017). Verführerische Überwachung blendet die Risiken einer Überwachung zugunsten des Komforts durch die Technik und des Staunens über den technischen Fortschritt aus. In den Videos scheint die digital-vernetze Konsumtechnik als modern und daher als begehrenswert (Zurawski, 2021). Die Handhabung der Geräte im Alltag durch Nutzende „wie du und ich“, wie sie in den Videos dargestellt wird, unterstreicht die Normalität und vermeintliche Datensicherheit der besprochenen Smart Speaker. Auf diese Weise sind die Tech-Influencer:innen, trotz der grundsätzlichen Differenz zum Marketing seitens der Hersteller:innen, für Neville (2021) primär Werbeträger:innen für eine Industrie, die sowohl am Absatz der Konsumtechnik als auch an den durch die Nutzung anfallenden Daten Interesse hat.

Wie vorliegende Untersuchungen verdeutlichen, wird in Unboxing- und Review-Videos und den entsprechenden Kommentaren wenig Wert auf die Datenpraktiken der Anbieter gelegt. Auch wenn Nevilles (2021) Sample sich auf englischsprachige Videos über Amazon-Alexa-Geräte beschränkt, kann davon ausgegangen werden, dass die Videos zu Smart Speakern anderer Anbieter ähnlich strukturiert sind. Zugleich beschäftigt sich Neville, wie er selbst einräumt, nur mit Unboxing-Videos im engeren Sinn. Wir hingegen wollen in unserer nun folgenden Fallanalyse zwei Review-Videos untersuchen, die weniger den Erstkontakt denn mehr ein Resümee nach einiger Zeit der Verwendung darstellen.

Zugleich möchten wir die Videos und ihr Umfeld nicht nur im Hinblick auf Fragen der ästhetischen Strategien und der (De)Thematisierung von Überwachung in den Videos diskutieren, sondern zudem im Hinblick auf Fragen der Bewertung (Lamont, 2012) der Smart Speaker untersuchen, d.h. inwiefern in den Review-Videos Kritik geäußert wird. Denn in Form der hier besprochenen Videos haben wir es mit einem Phänomen zu tun, das von zwei Seiten problematisiert wird: Unboxing-Videos gelten oftmals als Schleichwerbung, während die Smart Speaker als Datenkraken kritisiert werden. Wir gehen also davon aus, dass sich auch die YouTuber:innen in der Darstellung des praktischen Gebrauchs der Geräte notwendig kritisch zu den Werbeversprechen der Herstellenden verhalten müssen. Um sich von klassischen Werbeformaten zu unterscheiden, müssen die Akteure ihre „kritischen Kompetenzen“ (Boltanski & Thévenot, 1999) unter Beweis stellen. Sie müssen sich also nicht nur, wie Craig & Cunningham (2017) herausstellen, zu den Angeboten der Marketingfirmen positionieren, sondern auch gegenüber den Zuschauer:innen deutlich machen, inwiefern sie von diesen unabhängig sind. Mit Bezug auf die neuere Soziologie der Bewertung und ihre Anwendung auf digitale Phänomene (Kropf & Laser, 2019) ist also nicht nur die Bewertung der Produkte selbst von Interesse, also das „Was“ der Aussage, sondern auch das „Wie“ und damit die konkrete Einbettung der „kritischen Kompetenzen“ in audiovisuelle Narrative und Inszenierungsweisen. Kritik und andere Formen der Bewertung werden somit nicht als mehr oder weniger deutliche Orientierung an gesellschaftlichen Normen verstanden, sondern als situative Aushandlung zwischen Ego, Alter und jener materiellen Welt, welche die Bewertung überhaupt erst evoziert (Potthast, 2017). Diese pragmatische Perspektive auf Kritik geht also von kompetenten Akteur:innen aus, die Öffentlichkeit in der Äußerung von Kritik erst schaffen (müssen). Insofern ist Öffentlichkeit kein Zustand, sondern in ihrem Vollzug und als Praxis zu begreifen. Es ließe sich folglich die Frage stellen, welche Nischenöffentlichkeiten durch die Videos (ko-)produziert werden.

3 Sampling und methodisches Vorgehen

Die Untersuchung der Modi der Kritik in YouTube-Videos zu Smart Speakern ist eine Teilstudie eines umfangreicheren Forschungszusammenhangs im Sonderforschungsbereich Medien der Kooperation an der Universität Siegen, der sich mit dem Umgang und der Bewertung von Smart Speakern im häuslichen Kontext auseinandersetzt. Im Rahmen dieser Teilstudie wurden im Jahr 2020 insgesamt 39 Videos erhoben. Neben den uns interessierenden 23 Unboxing- und Review-Videos waren auch 16 Werbeclips der Herstellenden sowie Tutorial-Videos zu den Geräten, die von den Herstellenden auch auf YouTube verfügbar gemacht wurden, Teil des Samples, ebenso wie Videos, die YouTubenden grundlegende Strategien der Online-Selbstpräsentation vermitteln. Wir haben dabei gezielt nach deutschsprachigen Review- und Unboxing-Videos gesucht. Insgesamt wurden 27 Videos aus allen Kategorien einer genaueren Analyse unterzogen2. Die Videos beschäftigten sich mit den drei in Europa und Nordamerika am meisten verbreiteten Smart Speakern Echo von Amazon, Google Home (später umbenannt in Google Nest) und dem HomePod von Apple. Ziel war es, die Inszenierung der Smart Speaker durch YouTuber:innen mit der Ästhetik aus der Werbung und Anleitungsvideos zu vergleichen. Ausgespart wurden daher professionelle Berichterstattung aus dem Rundfunk sowie Videos, welche die Fehlkommunikation der Smart Speaker dokumentierten. Um die Einbettung der Videos in die Kanäle zu berücksichtigen, wurden des Weiteren acht Kanäle bzw. Profilseiten der YouTuber:innen im Hinblick auf die Anzahl der Videos und Abonnent:innen, Posting-Frequenz und die graphische Gestaltung einer Analyse unterzogen.

Gemäß des Theoretical Sampling (Strübing, 2014) – dem zufolge zuerst maximal kontrastive Fälle und im Verlauf der Untersuchung minimal kontrastive beziehungsweise im Hinblick auf bestimmte Aspekte kontrastive Fälle untersucht werden sollen – suchten wir die Videos über die Web-Oberfläche von YouTube durch generische Suchanfragen heraus und sichteten dabei auch Videos, die uns von YouTube als passend zu den bisher angeschauten Clips vorgeschlagen wurden. Dabei wurden sowohl Videos in das Sample einbezogen, die sich explizit mit dem Thema Datenschutz bei Smart Speakern beschäftigen, als auch solche, die das Thema nicht oder nur in einem Nebensatz erwähnten. Nach der Sichtung und Analyse einiger Videos suchten wir nicht nur gezielt nach den Reviews verschiedener Smart Speaker, sondern auch nach Exemplaren, die mit unterschiedlichem Aufwand und mit unterschiedlichen Graden an Professionalisierung produziert wurden. Um den zunehmenden Grad an Professionalisierung in der Videoproduktion zu untersuchen, wurden auch in einigen Fällen zwei Uploads des gleichen Kanals analysiert (in beiden Fällen thematisierten die Beiträge Smart-Speaker). Aus diesem Grund wurden auch Videos in die Untersuchung einbezogen, die bereits einige Jahre zuvor veröffentlicht worden sind.

Bei der inhaltlichen und dramaturgisch-ästhetischen Analyse orientierten wir uns an dem Verfahren zur Film- und Fernsehanalyse von Lothar Mikos (2015), welches es ermöglicht, vielfältige Medienprodukte systematisch auf inhaltliche, darstellerische, dramaturgische und ästhetisch-gestalterische Mittel hin zu untersuchen sowie die soziokulturellen Kontexte, in denen Produzent:innen und Rezipient:innen eingebettet sind, zu berücksichtigen. Das Publikum wird im Produktionsprozess grundsätzlich als Adressat:in der Botschaft mitgedacht, insbesondere im Hinblick auf die kognitive und emotionale Involvierung, die eine Identifikation mit den Figuren in den Videos erlaubt sowie soziale Nähe erzeugen soll. Da wir uns primär für die Ästhetik und Inhalte der Videos interessieren, haben wir davon abgesehen, die Kommentare unter den Videos ebenfalls zu analysieren.

Für die folgende Darstellung wollen wir uns auf zwei Videos beschränken. Während das erste Kurzvideo ein für unser Sample recht typischer Fall eines Produkttests ist, nimmt das zweite Video die grundsätzliche Kritik an Smart-Speaker- und Smart-Home-Technologien auf, problematisiert die Überwachungspraktiken und hat eher den Charakter eines Kommentars. Auf diese Weise kann herausgearbeitet werden, wie Smart Speaker einerseits in der Mehrzahl der Videos ohne großen Bezug zu Datenpraktiken besprochen werden und wie andererseits eine Diskussion dieser Datenpraktiken in die ästhetische und argumentative Logik des Review-Genres eingebettet wird. Bei der Auswahl der Videos war für uns relevant, dass deren Produzent:innen mit ihren Videos eine größere Reichweite haben, das heißt eine achtbare Anzahl an Abonnent:innen und Videoaufrufen vorweisen können.3 Die beiden YouTuber sind schon viele Jahre mit der Videoproduktion beschäftigt, sie veröffentlichen regelmäßig Clips und sie pflegen ihren Kanal zuverlässig. Sie konzentrieren sich weitestgehend auf das Bewerten von Konsumtechnik, während sich andere YouTuber:innen in unserem Sample sich mitunter auch für Gaming, Bushcrafting, Lauf- und Kochequipment interessieren. Ziel der Fallauswahl war es, möglichst zwei typische Videos aus dem Phänomenbereich Unboxing und Reviewing von Konsumtechnik zu finden, die die Genres aussagekräftig und prägnant repräsentieren (Baur & Lamnek, 2017). Diese Repräsentativität zeigt sich in der aufwändigen Gestaltung der Videos, der Einbettung in einen Kanal und in der Erstellung und Anwendung eines Vorschaubildes für die Videos. In diesem Sinn sind die Videos Zeugnis einer Professionalisierung der Videogestaltung auf YouTube durch Amateure. Des Weiteren dominieren männliche YouTuber das Genre. Laut Neville & Borkowski (o. J. im Erscheinen) sind Frauen, die Konsumtechnik besprechen, in der Minderheit; sie sind des Weiteren deutlich häufiger Häme und Spott ausgesetzt als männliche Tech-YouTuber. In der Gesamtschau reproduzieren sich bei Unboxing- und Review-Videos Geschlechterstereotype insofern, als vor allem Frauen Mode und Kosmetik (vgl. Prommer, Wegener & Linke, 2022, S. 144), Männer hingegen Konsumtechnik präsentieren.

4 Review-Videos im Fallvergleich

4.1 Fallbeispiel I „Techniklike“

Das Video mit dem Titel „Apple Home Pod – Ist er wirklich 349€ wert?“ wurde im Juli 2018 auf dem Kanal „Techniklike“ hochgeladen (Techniklike, 2018). Der Kanal wird von Jonas Falk seit 2013 betrieben, hat etwa 82.000 Abonnent:innen und seine Videos wurden nahezu 15 Millionen Mal aufgerufen (Stand Juli 2022). Die 666 Videos beinhalten vor allem Reviews von diversen Apple-Produkten, aber auch von anderen Smartphones, Laptops, Kameras, Uhren, Apps, Features und Zubehör. Das älteste abrufbare Video ist ein Bericht von der Internationalen Funkausstellung in Berlin und wurde 2013 hochgeladen. Die nachfolgenden frühen Videos scheint Jonas Falk überwiegend in seinem Kinderzimmer gedreht zu haben, ab 2017 dann offenbar aus dem Schlafzimmer einer eigenen Wohnung und seit 2020 werden die Videos in einem Studio produziert, das er sich mit mehreren YouTubern teilt (Techniklike, 2022).

Das Video ist in vielerlei Hinsicht prototypisch für das Review-Genre in unserem Sample. So ist es etwa vier Minuten lang und zeigt schon im Titel, dass es sich um die Besprechung eines bestimmten Produkts handelt. Gezeigt wird sowohl der damals 21-jährige Sprecher und Account-Inhaber Jonas Falk in halbnaher Einstellung in einem Zimmer als auch der HomePod in nahen Einstellungen an verschiedenen Orten im Raum oder in der Hand des Sprechers. Damit werden zugleich das Gerät und der Sprecher in Szene gesetzt. Nach der Begrüßung der Zuschauenden wird zunächst das zu testende Produkt annonciert und kurz das Ziel des Videos erläutert, dann folgt ein animiertes, originäres Logo als Intro und anschließend die eigentliche Besprechung des Geräts. Im Wesentlichen werden verschiedene Nutzungsszenarien durchgespielt. Der Sprecher verabschiedet sich mit einem Hinweis auf weitere Videos auf seinem Kanal und einem „Tschau“.

Der Sprecher, der sich in diesem Video nicht namentlich oder per Texteinblendung vorstellt, trägt ein blaues, einfarbiges T-Shirt, einen Drei-Tage-Bart und ein kleines Ansteckmikrophon am Halsausschnitt (Abbildung 1). Vor der Kamera wirkt er etwas steif. Der offensichtlich vorgefertigte Text wird kontrolliert vorgetragen. Beim Sprechen neigt der Reviewer zum Nuscheln, gibt sich aber merklich Mühe, die Wörter deutlich auszusprechen. Pausen zwischen Wörtern und Sätzen werden von ihm häufig verschluckt, die Betonungen muten zuweilen deplatziert an. Sein Blick wandert häufig in der Umgebung hin und her, dann wiederum starrt er in die Kamera, als wolle er es unbedingt vermeiden wegzuschauen. Obgleich er auf der visuellen Ebene etwas unbeholfen wirkt, sind seine Ausführungen informativ, verständlich und seine Argumentationen werden gut begründet. Auch wenn nicht er, sondern der HomePod im Bild ist, ist seine Stimme präsent. Er betont nicht offensiv, aber abgesichert seine eigene Meinung zu dem Produkt. Jonas Falk inszeniert sich dabei gewissermaßen kumpelhaft, aber nicht anbiedernd, indem er seine Zuschauer:innen duzt und ihnen zu Beginn „viel Spaß“ bei dem Video wünscht.

Halbnahe Einstellung des YouTubers Jonas Falk im Video des Kanals „Techniklike“ (Apple Home Pod – Ist er wirklich 349€ wert?, 2018)

Da es sich nicht um ein Unboxing-, sondern ein Review-Video handelt, spielt die Verpackung des Geräts nur zu Beginn des Videos eine Rolle: Statt des Geräts hält der YouTuber zuerst diese in die Kamera. Der Akt des Auspackens wird jedoch nicht gezeigt. Ebenso wird auf eine Darstellung der Inbetriebnahme verzichtet. Im Folgenden ist nur der HomePod selbst zu sehen. In einigen Einstellungen hält Falk das Gerät oder dessen Kabel in der Hand, in anderen steht es auf einem Tisch oder auf dem Holzfußboden und wird in Zooms und Nah-Einstellungen sowie als Teil eines Geräteensembles mit einem Bildschirm gezeigt. Die Einstellungen sind jeweils nur einige Sekunden lang. Das Bild bleibt dabei selten statisch, häufig werden kleine Schwenks eingesetzt. Zwar ist die händische Bedienung des Gerätes kurz zu sehen, eine Sprachbedienung wird jedoch nur in einer nachgestellten Szene angedeutet. Siri, die Stimme der KI des HomePods, bleibt also stumm. Lediglich die besondere Klangqualität des Lautsprechers wird im Video in einem Test, dem Vergleich mit kleinen Computerlautsprechern, hervorgehoben. So wird, wenn auch mit Einschränkungen, eine Art akustischer Direktvergleich suggeriert – einer der wenigen akustischen Eindrücke, welche das Video von dem Gerät vermittelt. Auf diese Weise wird das Gerät nicht nur als technische Apparatur, sondern zudem als Einrichtungsgegenstand in Szene gesetzt. Vor allem die visuelle Inszenierung des technischen Geräts greift dabei konventionelle Bildpraktiken der Werbung auf. Das gesamte Video ist mit einem Bokeh-Effekt gestaltet – der Hintergrund ist nur unscharf zu sehen, was das Gerät mit seinem schlichten Design mehr in den Vordergrund rückt (Abbildung 2). Die adaptierte Werbeästhetik zeigt sich im Vergleich (Abbildung 3) mit einem Werbe-Clip für den HomePod unter der Regie von Spike Jonze (2018 Welcome Home).

Produktinszenierung im Review-Video des Kanals „Techniklike“ (Apple HomePod, Google Home und Amazon Echo) (Apple Home Pod – Ist er wirklich 349€ wert?, 2018)