Zur Inszenierung von kritischen Kompetenzen in Nischenöffentlichkeiten

Bewertungen von Smart Speakern auf YouTube

David Waldecker ✉ Universität Siegen
Dagmar Hoffmann Universität Siegen

DOI:

https://doi.org/10.15460/kommges.2022.23.1.1000

Schlagworte:

Datenschutz, Konsumtechnik, Review-Videos, Smart Speaker, Unboxing, Warentest, Öffentlichkeit

Redaktion und Begutachtung

Nils Zurawski Universität Hamburg
Lina Franken Universität Vechta

Abstract

Der vorliegende Beitrag widmet sich der Analyse von Unboxing- und Review-Videos auf der Plattform YouTube, die sich vornehmlich mit dem Testen von Konsumtechnik beschäftigen. Die Videos zeigen das Auspacken und das Ausprobieren von Produkten, die Begutachtung ihrer Funktions- und Gebrauchsweisen und die Überprüfung ihrer Gebrauchsversprechen. Die Tests führen keine formal qualifizierten Warentester:innen durch, sondern in der Regel Nutzer:innen, die sich darauf spezialisiert haben. Unboxing- und Review-Videos können insofern als Element der Selbstinszenierung und -vermarktung von (pseudo-)privaten Praktiken des Auspackens und des Bewertens verstanden werden. Im Folgenden interessieren wir uns für das Testen und Bewerten von Smart Speakern, die im häuslichen Bereich zum Einsatz kommen. Im Sinne einer Sociology of Conventions and Testing (Potthast, 2017) wird anhand eines Fallvergleichs auf inhaltlicher Ebene danach gefragt, welche Aspekte der Geräte angesprochen werden, und auf ästhetischer Ebene, wie das Testen der Geräte von den YouTuber:innen inszeniert und in die Logik der Videoplattform eingebettet wird. Zugleich wird die Performanz der Produzierenden und ihrer kritischen Kompetenz untersucht. Der Beitrag stellt zudem dar, inwieweit Nutzungsbedingungen und insbesondere etwaige Datenschutzproblematiken, wie sie im öffentlichen Diskurs zumeist kritisch verhandelt und zuweilen auch in Werbespots thematisiert werden, in den Reviews zwischen einer Kritik und der Anpreisung der Produkte aufgegriffen werden.

1 Einleitung

Die Produktion und Rezeption von Online-Videos, vor allem über die Plattform YouTube, ist ein fester Bestandteil populärer Medienpraktiken. YouTube dient vielen als kostenlose Quelle für Unterhaltung wie Musik- und Sportvideos sowie Nachrichten. Aber auch genuin im Web entstandene Videoformate wie Let’s Play, ASMR oder Mok-Bang haben sich als Teil der Populärkultur etabliert. Dieser Beitrag untersucht das Phänomen der Unboxing- und Review-Videos, die ebenfalls als Web-Videoformat entstanden sind. Wir konzentrieren uns hier auf die Besprechung von Smart Speakern auf YouTube und fragen sowohl nach der Inszenierung der YouTuber:innen und der zu testenden Geräte als auch nach den Bewertungskriterien der Produktkritiken in diesen Videos, insbesondere in Hinblick auf kommerzielle Datenpraktiken.

Unboxing- und Review-Videos sind eine Variante von Videoformaten, die sich dem Auspacken und Bewerten von Konsumartikeln widmen. Während sogenannte Haul-Videos in diesem Sinn vor allem Kosmetik und Modeartikel diskutieren, sind es bei Unboxing-Videos primär Digitaltechnik wie Smartphones, Laptops oder Smart-Watches. Sie sind jedoch mehr als nur Produktberatung oder Social-Media-Entertainment (vgl. beispielsweise Craig & Cunningham, 2017, S. 78), sondern auch als ein Element von Öffentlichkeit zu verstehen. Sie greifen die Diskussion und Bewertung von technischen Artefakten und Diensten auf, die on- und offline in der Fach- und Publikumspresse – in Zeitschriften und Angeboten wie Technology Review, Stiftung Warentest und golem.de – geführt werden und werten sie durch das Video-Format narrativ und ästhetisch auf. Auf diese Weise sind sie zugleich in Konsumpraktiken wie den öffentlichen Diskurs über diese eingebunden.

Diese neue Form der Ver-Öffentlichung von zuvor lediglich privaten Bewertungen kann als eine Ermächtigung von Techniknutzenden verstanden werden. Die Videos verweisen des Weiteren auf die Entstehung einer neuen Sozialfigur (Moser & Schlechtriemen, 2018), die als YouTuber:in, Influencer:in oder Vlogger:in im Social-Media-Entertainment als Self-Made-Analogon zum Star des Studiokino-Systems fungiert. Sie gerät zunächst als Privatperson in die Öffentlichkeit und macht häufig den eigenen Alltag zum Thema ihrer Videos. Diese Sozialfiguren werden in der weiteren Öffentlichkeit wiederum als Produzierende von niveauloser Nabelschau, als gefährdender Einfluss auf Jüngere und als Träger von Schleichwerbung kritisiert (u.a. Fries, 2018, S. 75). In diesem Beitrag wollen wir diese Gemengelage von Medienformaten, Privatheit und Öffentlichkeit, Bewertung und Kritik an einer relativ neuen Medien- und Konsumtechnik diskutieren: der Bewertung von Smart Speakern und den zugehörigen Intelligenten Persönlichen Assistenten (IPAs) wie Amazon Echo mit Alexa, Google Nest und dem Google Assistant sowie Apples HomePod mit Siri. Diese Geräte werden sowohl im öffentlichen Diskurs als auch in der sozial- und medienwissenschaftlichen Diskussion als neueste Instanz eines „Überwachungskapitalismus“ (Zuboff, 2018) oder einer „Kolonialisierung“ des Alltags durch Internetkonzerne (Couldry & Mejias, 2019) verstanden. Sie stehen damit ebenso unter kritischer Beobachtung wie die YouTuber:innen (Nyomen & Schmitt, 2021), die sich mit ihnen öffentlich beschäftigen. Es stellt sich also die Frage, inwiefern die in den herkömmlichen Leitmedien (Reichelt & Hegemann, 2019), der politischen Bildung (Zuboff, 2019) und auch in Parlamenten geführte Debatte um die Risiken der Datenverwertung durch digitale Plattformen, insbesondere in der Auswertung von gesprochener Sprache (Turow, 2021), in der durch die YouTube-Videos erzeugten Öffentlichkeit thematisiert wird.

Dabei konzentrieren wir uns in unserem Beitrag weniger darauf, wer solche Videos aus welchen Motiven rezipiert, sondern vor allem auf die Darstellung und Besprechung der Smart Speaker durch reichweitenstarke Tech-YouTuber:innen. Mit Bezug auf die Soziologie der Bewertung, den Strukturwandel und die Hybridisierung von Öffentlichkeit(en) fragen wir uns: In welcher spezifischen Rolle agieren die YouTuber:innen auf der Plattform und inwieweit präsentieren sie sich als ermächtigt, Bewertungen der Geräte vorzunehmen? Wie gehen die YouTuber:innen mit den Diskussionen um die Problematik der auditiven Kontrolle und Überwachung des privaten Wohnraums im Kontext der Smart-Speaker-Nutzung um? Uns interessieren in diesem Zusammenhang in ästhetisch-dramaturgischer Hinsicht sowohl die (Selbst-)Inszenierungen der (vermeintlichen) Expert:innen als auch die der Geräte.

Unser Beitrag ist wie folgt gegliedert: Nach einer Darstellung der Forschungsliteratur zu Unboxing- und Review-Videos, zu YouTuber:innen und Öffentlichkeiten einerseits und der Diskussion um die Datenpraktiken der Smart-Speaker-Nutzung andererseits (Abschnitt 2), sowie der Vorstellung unseres Samples und des methodischen Vorgehens (3) erläutern wir fallvergleichend, wie zwei in diesem Segment etablierte YouTuber sich, die Smart Speaker, ihre häusliche Medienaneignung und nicht zuletzt ihre Bewertungskompetenz präsentieren (4). Abschließend diskutieren wir die Ergebnisse und die Konsequenzen für weitere Forschung (5).

2 Akteure und Formate von Bewertungsvideos auf YouTube

2.1 Unboxing- und Review-Videos als Genres

Unboxing- und Review-Videos sind als Genres erst unter Online-Bedingungen entstanden. Als eines der ersten gilt ein Video einer Technikzeitschrift, welches das Entpacken eines Nokia-Handys zeigt (Unbox.IT, 2006). Die Videos greifen in produktionsästhetischer Hinsicht gleichwohl auf verschiedene Film- und Fernsehkonventionen zurück, welche sie in der Präsentation der Konsumtechnik und der Testenden in eine neue Konstellation bringen. Indem die Videos selbst anhand von Klickzahlen gerankt und durch Kommentare und Likes bewertet werden, sind sie Teil dessen, was in der neueren Soziologie der Bewertung und des Testens (Potthast, 2017) als Ubiquität von Bewertung im Digitalen angesehen wird (Kropf & Laser, 2019). Sie sind aber zugleich als Zeugnis der Verankerung dieser digitalen Bewertungskulturen in herkömmlichen kulturellen Formen zu verstehen, die hier zugleich auf YouTube plattformisiert auftreten (Gillespie, 2010) und sich mit der Besprechung von Smart Speakern einem plattformisierten Thema (Pridmore et al., 2019) widmen, da die Smart Speaker, die zugehörige automatische Sprachverarbeitung und die Verknüpfung mit anderen Smart-Home-Geräten jeweils komplett von einem Anbieter zur Verfügung gestellt werden.

Unboxing-Videos verwenden laut Sharif Mowlabocus (2020, S. 566) sowohl Inszenierungselemente aus Koch-, Garten- und Wissenschaftssendungen, aber auch der kommerziellen (ebd., S. 567) sowie Amateurpornographie (ebd., S. 573): „Unboxing videos cannot function without the act of unboxing and, as with pornography, this act speaks to our desire to witness the crossing of a boundary, seeing something for the first time.“ (ebd., S. 567) Des Weiteren werden in der Präsentation der Artefakte Inszenierungstechniken aus dem Tele-Shopping aufgegriffen, um die Haptik der Geräte zu visualisieren: “[R]emote shopping has long relied heavily on close-up shots of hands holding, caressing and modelling all manner of items, as the camera moves slowly over the surfaces of the object” (ebd., S. 574). Die von Mowlabocus erwähnten Analogien machen deutlich, dass die Inszenierung bewusst auf den haptischen Umgang mit einem neuen Gerät und auf dessen Ästhetik fokussiert.

Review-Videos verfolgen ästhetisch ähnliche Strategien, beschränken sich aber meist nicht auf einen ersten Eindruck eines Geräts, sondern ziehen nach einer Weile der Nutzung Bilanz oder testen die bereits installierten bzw. in Betrieb genommenen Geräte oder Gegenstände vor der Kamera. Neben den Nahaufnahmen der Geräte greifen beide Formate ebenfalls das Testimonial aus dem Tele-Shopping und Werbe-Clips auf – das persönliche Bekenntnis einer prominenten oder scheinbar spontan auf der Straße befragten Person bezüglich eines Themas oder einer Ware. Daher rückt nicht nur das besprochene Gerät, sondern auch die Person, welche das Gerät entpackt und bewertet, in den Vordergrund. Um Vertrauen aufzubauen, werden von den Rezensent:innen nicht nur die Produkte beschrieben, sondern die Akteur:innen werden in vielen Videos auch bei der Verwendung des Produkts gezeigt.¹

Die Videos stehen dabei nicht für sich, sondern verweisen in vielerlei Hinsicht auf den Kontext der Videos. So produzieren YouTuber:innen meist in regelmäßigen Abständen neue Videos und veröffentlichen diese auf ihrem YouTube-Kanal, der in gewisser Weise mit den Konten in anderen Social-Media-Plattformen vergleichbar ist. Ebenso wie bei etwa Instagram werden neben einem spezifischen Namen bei der Kanal-Ansicht auf YouTube auch die Anzahl der Abonnierenden und die Anzahl der Beiträge angezeigt. Damit können die Videos einer Person zugeordnet werden und auch dem Publikum, das Kanäle abonnieren kann, besser nähergebracht werden. Durch die Kanäle, vor allem aber durch die mehr oder weniger regelmäßigen Veröffentlichungen sind die Videos in eine Serialität eingebettet, die in den Videos auch durch kanalspezifische Gestaltung wie Jingles, Animationen, Logos und durch die Moderation durch die gleiche YouTuber:in verstärkt wird. Zugleich lässt sich bei vielen der populäreren Kanäle eine thematische Engführung auf eine Produktkategorie oder sogar Produkte einer bestimmten Firma beobachten. In den Videos selbst wiederum wird häufig auf die Kanäle und deren Abonniermöglichkeit und auf weitere Videos aus dem Kanal verwiesen. Wie wir weiter unten ausführen, verbinden die Videos auf diese Weise Elemente der Serialität, die aus dem Fernsehen bekannt sind, mit jenen von Social-Media-Plattformen, zu denen unter anderem die Personalisierung zählt.

2.2 YouTuber:innen als nahbare Produzierende von Öffentlichkeit

Unboxing- und Review-Videos können in einen Kontext von „Lifestyle-Videos“ (Geimer, 2018, S. 7) gestellt werden, da sie immer auch die Filmenden selbst inszenieren. Wie Craig & Cunningham (2017, S. 78) deutlich machen, werden diese Videos von „rapidly professionalising-amateur content creators“ hergestellt, die daran arbeiten, ihren YouTube-Kanal in eine „own media brand“ zu verwandeln. Diese Professionalisierung zielt über die ästhetische Aufwertung der Videos, die bei den erfolgreichen Kanälen kaum noch Amateurhaftes an sich haben, darauf ab, die YouTuber:innen selbst als interessant erscheinen zu lassen. Diese „creator labour“ (ebd., S. 82) haben Craig und Cunningham in ihrer Studie im Blick, wenn sie die Betreiber:innen von (erfolgreichen) Kanälen für Spielzeug-Unboxing interviewen. In den Interviews wird deutlich, dass die YouTuber:innen sich dabei „discourses of authenticity and community“ (ebd., S. 84) verpflichtet fühlen und nicht auf jedes Kooperationsangebot von Produktherstellenden eingehen. Der Werbeeffekt für die entsprechenden Produkte und der etwaige monetäre Zugewinn, der nicht immer konkret durch die YouTuber:innen angegeben wird, werden dabei von den YouTuber:innen letztlich mit dem Effekt dieser Produktbesprechung auf das öffentliche Bild der Person in Beziehung gesetzt. Indirekte Werbung für Produkte wird also gegenüber der Werbung für den eigenen Kanal, als welche sich jedes Video wiederum erweist, abgewogen.

Auch Wagner & Forytarczyk (2015, S. 10) erwähnen in ihrer Studie über die Produzent:innen von Haul-Videos die Zusammenarbeit mit „Firmen zu Marketingzwecken“ und die oben beschriebenen Strategien, „trotz dieser marketingförmigen Praxis authentisch zu bleiben“. Die „creator labour“ besteht nicht nur in dem Umgang mit etwaigen Sponsor:innen und Finanziers. Ganz grundsätzlich müssen YouTuber:innen als Ausführende – in einer Person zuständig für Darstellung, Kamera, Ton, Regie und Schnitt – viele ästhetisch und dramaturgisch bedeutsame Entscheidungen treffen, die bei herkömmlichen Produktionsfirmen auf mehreren Schultern verteilt sind. Die von den Autorinnen diskutierten Inszenierungspraktiken von Haul-Videos sind so auch für die Analyse von Unboxing-Videos relevant. Die von ihnen interviewten YouTuberinnen machen deutlich, dass sie sich an anderen Videos orientieren und dabei „[g]ute Kopien” erzeugen. Obwohl sie also vielfach gestalterische Mittel anderer übernehmen, zeigen sie sich gleichwohl als „selbstbewusste Sprecherinnen“ (ebd., S. 8), indem sie darüber reflektieren, wie und mit Bezug auf welche ästhetischen Strategien sie sich einer Öffentlichkeit gegenüber darstellen. Dabei wird laut Wagner & Forytarczyk (2015, S. 18) eine „Nischen-Öffentlichkeit“ adressiert. Es geht den YouTuber:innen also nicht um eine deliberative Öffentlichkeit im Sinne von Habermas (1990), in welcher Argumente über gesellschaftliche Probleme ausgetauscht werden; vielmehr werden gezielt Gleichgesinnte adressiert, die sich jeweils beispielsweise für Kosmetik, Konsumtechnik oder Spielzeug interessieren. Bei der Zuordnung des Publikums spielen nicht nur die in den Sozialen Medien verwendeten Sortier- und Empfehlungsmechanismen eine Rolle; die YouTuber:innen und ihr Publikum achten laut Wagner & Forytarczyk (2015, S. 11f.) selbst darauf, dass negative Kommentare zu den Videos ausgeblendet oder gelöscht werden. Diese Form von personalisierter Öffentlichkeit, die sich von vornherein nur an Interessierte richtet und diese regelmäßig mit sich formal und inhaltlich ähnelnden Videos bedient, erzeugt somit immer auch Aufmerksamkeit für die produzierende Person.

Aus einer Perspektive der Soziologie der Bewertung im Sinne Boltanski & Thévenot (2007) finden sich damit die YouTuber:innen in der Rechtfertigungsordnung der partizipativen Ökonomie der Aufmerksamkeit, aber auch der marktförmigen Ökonomie der Aufmerksamkeit, wie sie Kessous (2015) analysiert hat. Während in Kessousʼ Darstellung die partizipative Form durch die Nutzenden der Plattformen und die marktförmige durch die Betreibenden der Plattform Verwendung finden, sind in den Praktiken der YouTuber:innen beide Formen im Gebrauch. Denn zum einen zeigen sich die YouTuber:innen ihrer Community verpflichtet; zugleich versuchen sie aber auch, die ihnen geschenkte Aufmerksamkeit zu monetarisieren, indem sie etwa auf Affiliate-Links verweisen, über die sie beim Kauf von Produkten Provision beziehen (Frühbrodt & Floren, 2019). Während in den Videos nicht immer offengelegt wird, ob die YouTuber:innen das besprochene Produkt selbst gekauft oder durch Firmen zur Verfügung gestellt bekommen haben, gehen YouTuber:innen in ihren Videos teils explizit darauf ein, dass sie mit den Videos ihren Lebensunterhalt finanzieren wollen. Dies ist aus der Art der Inszenierung, in der die ‚ganze’ Person thematisiert wird, verständlich, sorgt aber zugleich für Transparenz. Diese wird auch in Bezug auf die Produktion der Videos gepflegt, da einige YouTuber:innen in Videos erklären, mit welchen Geräten, welcher Software und welchen Verfahren sie die Videos produzieren. Die YouTuber:innen geben dem Publikum auf diesem Weg Hinweise, wie sie selbst gegebenenfalls solche Videos anfertigen können. Dadurch wird trotz der durch die YouTuber:innen verfolgten Professionalisierung die relative Nähe von YouTuber:innen und Zuschauer:innen betont.

Dass Gleichgesinnte in einem egalitären Sinn adressiert werden, zeigt sich am direkten Agieren der YouTuber:innen mit einer nicht näher benannten Person durch die Kamera. Der Zuschauer/die Zuschauerin wird unmittelbar in das Geschehen eingebunden. Diese Sprecherfigur hat Stephen J. Neville (2021) in Anlehnung an Maria Bakardjieva (2005, S. 98f.) als jene des „online warm expert“ beschrieben. Bakardijeva beschreibt mit dem Begriff des „warm expert“ jene Personen, die von Techniknutzenden wegen ihrer größeren technischen Erfahrung und der direkten Bekanntschaft um Rat gefragt werden. Sie hat die Aneignungsprozesse von digital-vernetzter Medientechnik aus der Perspektive der Domestizierungsforschung untersucht und dabei herausgestellt, dass die Aneignung nicht nur im Haushalt – dem klassischen Topos der Domestizierungstheorie (vgl. Silverstone, Hirsch & Morley, 1992) – sondern ebenfalls durch das persönliche Umfeld des Haushalts vermittelt ist. Den „warm experts“ wird nicht Vertrauen entgegengebracht, weil sie durch eine Berufsausbildung qualifizierte Aussagen treffen können, sondern weil sie schlicht einen Wissensvorsprung im Umgang mit den jeweils interessierenden technischen Artefakten und Diensten haben. Es ist dieses praktische Wissen gepaart mit der Erreichbarkeit, welche die „warm experts“ für die potentiellen Nutzenden interessant machen (Bakardjieva, 2005). Die „online warm experts“ fungieren nun über die Plattform YouTube als eine digitale Form dieser Bekanntschaften, die in verständlicher Sprache über Einsatzmöglichkeiten und Bedienkonzepte von digitaler Konsumtechnik sprechen, Kaufempfehlungen abgeben und des Weiteren über die Kommentarfunktion bei YouTube und über weitere Social-Media-Kanäle auch für Fragen zur Verfügung stehen (Neville, 2021). Daher, so unsere Überlegung, steht in diesen Videos der unmittelbare Gebrauch der Geräte im Vordergrund. Prüfkriterien, wie man sie aus institutionalisierten, unabhängigen Warentests kennt (Primus, 2017), technische Details und Prozesse werden eher selten erläutert, weil sie aus der Sicht der Konsument:innen – und um solche handelt es sich bei den „online warm experts“ ebenso – nicht unmittelbar verfügbar sind und vielfach für den alltäglichen Gebrauch auch nicht als bekannt vorausgesetzt werden müssen.

2.3 Handhabung und Datenschutz als Testkriterien

Die soeben beschriebenen Logiken der Bewertung werden laut Neville (2021, S. 1293) jedoch zum Problem, wenn es in den Videos, wie im Fall von Smart Speakern, um Digitaltechnik geht, die in die extensive Auswertung von Nutzungsdaten eingebunden ist. Folglich zeigt seine Analyse von Unboxing-Videos von Amazon-Echo-Geräten, dass Datenschutz und Schutz der Privatsphäre in diesen Videos kaum Berücksichtigung finden (ebd., S. 1302). Dieser Befund ist insofern interessant, als die Debatte um diese Ausnutzung von Nutzungsdaten nicht nur in der Wissenschaft (vgl. etwa Srnicek, 2018), sondern auch in der breiteren Öffentlichkeit geführt wird (Turow, 2021). Smart Speaker werden etwa von Zuboff als Speerspitze einer Verwertung des „Verhaltensüberschusses“ (Zuboff, 2018, S. 97) gedeutet, da sie ein Abschöpfen nicht nur von Online-Nutzungsdaten wie etwa durch Google, oder Verkaufsdaten wie etwa durch Amazon, sondern auch von häuslichen Alltagspraktiken erlauben (ebd. S. 297). Neben dieser Verwertung von Nutzungsdaten für die Erstellung von Kundenprofilen für die Plattformen der drei großen Anbieter Amazon (vgl. West, 2022), Google und Apple, werden die anfallenden Sprachdaten jedoch auch für das Training der automatischen Spracherkennung verwendet, wobei diese Spracherkennung von den Anbietern wiederum im Call-Center-Bereich vermarktet wird (Waldecker & Volmar, 2022, S. 175). Mit Bezug auf diese Debatte entscheiden sich nicht wenige gegen die Anschaffung eines Smart Speakers (Lau, Zimmerman & Schaub, 2018).

In Nevilles Darstellung gerät die Verantwortung der YouTuber:innen in den Blick, sich zu solchen Datenpraktiken zu verhalten. Zu grundsätzlicher Kritik an der Technik und insbesondere der Datenauswertung durch Anbietende und Dritte sind die YouTuber:innen laut Neville (2021) nicht fähig, weil sie in ihren Videos die Technik als grundsätzlich begehrenswert darstellen. Während einzelne Aspekte der Geräte kritisiert werden, steht die Sinnhaftigkeit der Nutzung solcher digitaler Assistenten in den Videos außer Frage. Neville (2021, S. 1293) bezieht sich in diesem Zusammenhang auf Pinelopi Troullinous Begriff der „seductive surveillance“ (vgl. Troullinou, 2017). Verführerische Überwachung blendet die Risiken einer Überwachung zugunsten des Komforts durch die Technik und des Staunens über den technischen Fortschritt aus. In den Videos scheint die digital-vernetze Konsumtechnik als modern und daher als begehrenswert (Zurawski, 2021). Die Handhabung der Geräte im Alltag durch Nutzende „wie du und ich“, wie sie in den Videos dargestellt wird, unterstreicht die Normalität und vermeintliche Datensicherheit der besprochenen Smart Speaker. Auf diese Weise sind die Tech-Influencer:innen, trotz der grundsätzlichen Differenz zum Marketing seitens der Hersteller:innen, für Neville (2021) primär Werbeträger:innen für eine Industrie, die sowohl am Absatz der Konsumtechnik als auch an den durch die Nutzung anfallenden Daten Interesse hat.

Wie vorliegende Untersuchungen verdeutlichen, wird in Unboxing- und Review-Videos und den entsprechenden Kommentaren wenig Wert auf die Datenpraktiken der Anbieter gelegt. Auch wenn Nevilles (2021) Sample sich auf englischsprachige Videos über Amazon-Alexa-Geräte beschränkt, kann davon ausgegangen werden, dass die Videos zu Smart Speakern anderer Anbieter ähnlich strukturiert sind. Zugleich beschäftigt sich Neville, wie er selbst einräumt, nur mit Unboxing-Videos im engeren Sinn. Wir hingegen wollen in unserer nun folgenden Fallanalyse zwei Review-Videos untersuchen, die weniger den Erstkontakt denn mehr ein Resümee nach einiger Zeit der Verwendung darstellen.

Zugleich möchten wir die Videos und ihr Umfeld nicht nur im Hinblick auf Fragen der ästhetischen Strategien und der (De)Thematisierung von Überwachung in den Videos diskutieren, sondern zudem im Hinblick auf Fragen der Bewertung (Lamont, 2012) der Smart Speaker untersuchen, d.h. inwiefern in den Review-Videos Kritik geäußert wird. Denn in Form der hier besprochenen Videos haben wir es mit einem Phänomen zu tun, das von zwei Seiten problematisiert wird: Unboxing-Videos gelten oftmals als Schleichwerbung, während die Smart Speaker als Datenkraken kritisiert werden. Wir gehen also davon aus, dass sich auch die YouTuber:innen in der Darstellung des praktischen Gebrauchs der Geräte notwendig kritisch zu den Werbeversprechen der Herstellenden verhalten müssen. Um sich von klassischen Werbeformaten zu unterscheiden, müssen die Akteure ihre „kritischen Kompetenzen“ (Boltanski & Thévenot, 1999) unter Beweis stellen. Sie müssen sich also nicht nur, wie Craig & Cunningham (2017) herausstellen, zu den Angeboten der Marketingfirmen positionieren, sondern auch gegenüber den Zuschauer:innen deutlich machen, inwiefern sie von diesen unabhängig sind. Mit Bezug auf die neuere Soziologie der Bewertung und ihre Anwendung auf digitale Phänomene (Kropf & Laser, 2019) ist also nicht nur die Bewertung der Produkte selbst von Interesse, also das „Was“ der Aussage, sondern auch das „Wie“ und damit die konkrete Einbettung der „kritischen Kompetenzen“ in audiovisuelle Narrative und Inszenierungsweisen. Kritik und andere Formen der Bewertung werden somit nicht als mehr oder weniger deutliche Orientierung an gesellschaftlichen Normen verstanden, sondern als situative Aushandlung zwischen Ego, Alter und jener materiellen Welt, welche die Bewertung überhaupt erst evoziert (Potthast, 2017). Diese pragmatische Perspektive auf Kritik geht also von kompetenten Akteur:innen aus, die Öffentlichkeit in der Äußerung von Kritik erst schaffen (müssen). Insofern ist Öffentlichkeit kein Zustand, sondern in ihrem Vollzug und als Praxis zu begreifen. Es ließe sich folglich die Frage stellen, welche Nischenöffentlichkeiten durch die Videos (ko-)produziert werden.

3 Sampling und methodisches Vorgehen

Die Untersuchung der Modi der Kritik in YouTube-Videos zu Smart Speakern ist eine Teilstudie eines umfangreicheren Forschungszusammenhangs im Sonderforschungsbereich Medien der Kooperation an der Universität Siegen, der sich mit dem Umgang und der Bewertung von Smart Speakern im häuslichen Kontext auseinandersetzt. Im Rahmen dieser Teilstudie wurden im Jahr 2020 insgesamt 39 Videos erhoben. Neben den uns interessierenden 23 Unboxing- und Review-Videos waren auch 16 Werbeclips der Herstellenden sowie Tutorial-Videos zu den Geräten, die von den Herstellenden auch auf YouTube verfügbar gemacht wurden, Teil des Samples, ebenso wie Videos, die YouTubenden grundlegende Strategien der Online-Selbstpräsentation vermitteln. Wir haben dabei gezielt nach deutschsprachigen Review- und Unboxing-Videos gesucht. Insgesamt wurden 27 Videos aus allen Kategorien einer genaueren Analyse unterzogen². Die Videos beschäftigten sich mit den drei in Europa und Nordamerika am meisten verbreiteten Smart Speakern Echo von Amazon, Google Home (später umbenannt in Google Nest) und dem HomePod von Apple. Ziel war es, die Inszenierung der Smart Speaker durch YouTuber:innen mit der Ästhetik aus der Werbung und Anleitungsvideos zu vergleichen. Ausgespart wurden daher professionelle Berichterstattung aus dem Rundfunk sowie Videos, welche die Fehlkommunikation der Smart Speaker dokumentierten. Um die Einbettung der Videos in die Kanäle zu berücksichtigen, wurden des Weiteren acht Kanäle bzw. Profilseiten der YouTuber:innen im Hinblick auf die Anzahl der Videos und Abonnent:innen, Posting-Frequenz und die graphische Gestaltung einer Analyse unterzogen.

Gemäß des Theoretical Sampling (Strübing, 2014) – dem zufolge zuerst maximal kontrastive Fälle und im Verlauf der Untersuchung minimal kontrastive beziehungsweise im Hinblick auf bestimmte Aspekte kontrastive Fälle untersucht werden sollen – suchten wir die Videos über die Web-Oberfläche von YouTube durch generische Suchanfragen heraus und sichteten dabei auch Videos, die uns von YouTube als passend zu den bisher angeschauten Clips vorgeschlagen wurden. Dabei wurden sowohl Videos in das Sample einbezogen, die sich explizit mit dem Thema Datenschutz bei Smart Speakern beschäftigen, als auch solche, die das Thema nicht oder nur in einem Nebensatz erwähnten. Nach der Sichtung und Analyse einiger Videos suchten wir nicht nur gezielt nach den Reviews verschiedener Smart Speaker, sondern auch nach Exemplaren, die mit unterschiedlichem Aufwand und mit unterschiedlichen Graden an Professionalisierung produziert wurden. Um den zunehmenden Grad an Professionalisierung in der Videoproduktion zu untersuchen, wurden auch in einigen Fällen zwei Uploads des gleichen Kanals analysiert (in beiden Fällen thematisierten die Beiträge Smart-Speaker). Aus diesem Grund wurden auch Videos in die Untersuchung einbezogen, die bereits einige Jahre zuvor veröffentlicht worden sind.

Bei der inhaltlichen und dramaturgisch-ästhetischen Analyse orientierten wir uns an dem Verfahren zur Film- und Fernsehanalyse von Lothar Mikos (2015), welches es ermöglicht, vielfältige Medienprodukte systematisch auf inhaltliche, darstellerische, dramaturgische und ästhetisch-gestalterische Mittel hin zu untersuchen sowie die soziokulturellen Kontexte, in denen Produzent:innen und Rezipient:innen eingebettet sind, zu berücksichtigen. Das Publikum wird im Produktionsprozess grundsätzlich als Adressat:in der Botschaft mitgedacht, insbesondere im Hinblick auf die kognitive und emotionale Involvierung, die eine Identifikation mit den Figuren in den Videos erlaubt sowie soziale Nähe erzeugen soll. Da wir uns primär für die Ästhetik und Inhalte der Videos interessieren, haben wir davon abgesehen, die Kommentare unter den Videos ebenfalls zu analysieren.

Für die folgende Darstellung wollen wir uns auf zwei Videos beschränken. Während das erste Kurzvideo ein für unser Sample recht typischer Fall eines Produkttests ist, nimmt das zweite Video die grundsätzliche Kritik an Smart-Speaker- und Smart-Home-Technologien auf, problematisiert die Überwachungspraktiken und hat eher den Charakter eines Kommentars. Auf diese Weise kann herausgearbeitet werden, wie Smart Speaker einerseits in der Mehrzahl der Videos ohne großen Bezug zu Datenpraktiken besprochen werden und wie andererseits eine Diskussion dieser Datenpraktiken in die ästhetische und argumentative Logik des Review-Genres eingebettet wird. Bei der Auswahl der Videos war für uns relevant, dass deren Produzent:innen mit ihren Videos eine größere Reichweite haben, das heißt eine achtbare Anzahl an Abonnent:innen und Videoaufrufen vorweisen können.³ Die beiden YouTuber sind schon viele Jahre mit der Videoproduktion beschäftigt, sie veröffentlichen regelmäßig Clips und sie pflegen ihren Kanal zuverlässig. Sie konzentrieren sich weitestgehend auf das Bewerten von Konsumtechnik, während sich andere YouTuber:innen in unserem Sample sich mitunter auch für Gaming, Bushcrafting, Lauf- und Kochequipment interessieren. Ziel der Fallauswahl war es, möglichst zwei typische Videos aus dem Phänomenbereich Unboxing und Reviewing von Konsumtechnik zu finden, die die Genres aussagekräftig und prägnant repräsentieren (Baur & Lamnek, 2017). Diese Repräsentativität zeigt sich in der aufwändigen Gestaltung der Videos, der Einbettung in einen Kanal und in der Erstellung und Anwendung eines Vorschaubildes für die Videos. In diesem Sinn sind die Videos Zeugnis einer Professionalisierung der Videogestaltung auf YouTube durch Amateure. Des Weiteren dominieren männliche YouTuber das Genre. Laut Neville & Borkowski (o. J. im Erscheinen) sind Frauen, die Konsumtechnik besprechen, in der Minderheit; sie sind des Weiteren deutlich häufiger Häme und Spott ausgesetzt als männliche Tech-YouTuber. In der Gesamtschau reproduzieren sich bei Unboxing- und Review-Videos Geschlechterstereotype insofern, als vor allem Frauen Mode und Kosmetik (vgl. Prommer, Wegener & Linke, 2022, S. 144), Männer hingegen Konsumtechnik präsentieren.

4 Review-Videos im Fallvergleich

4.1 Fallbeispiel I „Techniklike“

Das Video mit dem Titel „Apple Home Pod – Ist er wirklich 349€ wert?“ wurde im Juli 2018 auf dem Kanal „Techniklike“ hochgeladen (Techniklike, 2018). Der Kanal wird von Jonas Falk seit 2013 betrieben, hat etwa 82.000 Abonnent:innen und seine Videos wurden nahezu 15 Millionen Mal aufgerufen (Stand Juli 2022). Die 666 Videos beinhalten vor allem Reviews von diversen Apple-Produkten, aber auch von anderen Smartphones, Laptops, Kameras, Uhren, Apps, Features und Zubehör. Das älteste abrufbare Video ist ein Bericht von der Internationalen Funkausstellung in Berlin und wurde 2013 hochgeladen. Die nachfolgenden frühen Videos scheint Jonas Falk überwiegend in seinem Kinderzimmer gedreht zu haben, ab 2017 dann offenbar aus dem Schlafzimmer einer eigenen Wohnung und seit 2020 werden die Videos in einem Studio produziert, das er sich mit mehreren YouTubern teilt (Techniklike, 2022).

Das Video ist in vielerlei Hinsicht prototypisch für das Review-Genre in unserem Sample. So ist es etwa vier Minuten lang und zeigt schon im Titel, dass es sich um die Besprechung eines bestimmten Produkts handelt. Gezeigt wird sowohl der damals 21-jährige Sprecher und Account-Inhaber Jonas Falk in halbnaher Einstellung in einem Zimmer als auch der HomePod in nahen Einstellungen an verschiedenen Orten im Raum oder in der Hand des Sprechers. Damit werden zugleich das Gerät und der Sprecher in Szene gesetzt. Nach der Begrüßung der Zuschauenden wird zunächst das zu testende Produkt annonciert und kurz das Ziel des Videos erläutert, dann folgt ein animiertes, originäres Logo als Intro und anschließend die eigentliche Besprechung des Geräts. Im Wesentlichen werden verschiedene Nutzungsszenarien durchgespielt. Der Sprecher verabschiedet sich mit einem Hinweis auf weitere Videos auf seinem Kanal und einem „Tschau“.

Der Sprecher, der sich in diesem Video nicht namentlich oder per Texteinblendung vorstellt, trägt ein blaues, einfarbiges T-Shirt, einen Drei-Tage-Bart und ein kleines Ansteckmikrophon am Halsausschnitt (Abbildung 1). Vor der Kamera wirkt er etwas steif. Der offensichtlich vorgefertigte Text wird kontrolliert vorgetragen. Beim Sprechen neigt der Reviewer zum Nuscheln, gibt sich aber merklich Mühe, die Wörter deutlich auszusprechen. Pausen zwischen Wörtern und Sätzen werden von ihm häufig verschluckt, die Betonungen muten zuweilen deplatziert an. Sein Blick wandert häufig in der Umgebung hin und her, dann wiederum starrt er in die Kamera, als wolle er es unbedingt vermeiden wegzuschauen. Obgleich er auf der visuellen Ebene etwas unbeholfen wirkt, sind seine Ausführungen informativ, verständlich und seine Argumentationen werden gut begründet. Auch wenn nicht er, sondern der HomePod im Bild ist, ist seine Stimme präsent. Er betont nicht offensiv, aber abgesichert seine eigene Meinung zu dem Produkt. Jonas Falk inszeniert sich dabei gewissermaßen kumpelhaft, aber nicht anbiedernd, indem er seine Zuschauer:innen duzt und ihnen zu Beginn „viel Spaß“ bei dem Video wünscht.

Halbnahe Einstellung des YouTubers Jonas Falk im Video des Kanals „Techniklike“ (Apple Home Pod – Ist er wirklich 349€ wert?, 2018)

Da es sich nicht um ein Unboxing-, sondern ein Review-Video handelt, spielt die Verpackung des Geräts nur zu Beginn des Videos eine Rolle: Statt des Geräts hält der YouTuber zuerst diese in die Kamera. Der Akt des Auspackens wird jedoch nicht gezeigt. Ebenso wird auf eine Darstellung der Inbetriebnahme verzichtet. Im Folgenden ist nur der HomePod selbst zu sehen. In einigen Einstellungen hält Falk das Gerät oder dessen Kabel in der Hand, in anderen steht es auf einem Tisch oder auf dem Holzfußboden und wird in Zooms und Nah-Einstellungen sowie als Teil eines Geräteensembles mit einem Bildschirm gezeigt. Die Einstellungen sind jeweils nur einige Sekunden lang. Das Bild bleibt dabei selten statisch, häufig werden kleine Schwenks eingesetzt. Zwar ist die händische Bedienung des Gerätes kurz zu sehen, eine Sprachbedienung wird jedoch nur in einer nachgestellten Szene angedeutet. Siri, die Stimme der KI des HomePods, bleibt also stumm. Lediglich die besondere Klangqualität des Lautsprechers wird im Video in einem Test, dem Vergleich mit kleinen Computerlautsprechern, hervorgehoben. So wird, wenn auch mit Einschränkungen, eine Art akustischer Direktvergleich suggeriert – einer der wenigen akustischen Eindrücke, welche das Video von dem Gerät vermittelt. Auf diese Weise wird das Gerät nicht nur als technische Apparatur, sondern zudem als Einrichtungsgegenstand in Szene gesetzt. Vor allem die visuelle Inszenierung des technischen Geräts greift dabei konventionelle Bildpraktiken der Werbung auf. Das gesamte Video ist mit einem Bokeh-Effekt gestaltet – der Hintergrund ist nur unscharf zu sehen, was das Gerät mit seinem schlichten Design mehr in den Vordergrund rückt (Abbildung 2). Die adaptierte Werbeästhetik zeigt sich im Vergleich (Abbildung 3) mit einem Werbe-Clip für den HomePod unter der Regie von Spike Jonze (2018 Welcome Home).

Produktinszenierung im Review-Video des Kanals „Techniklike“ (Apple HomePod, Google Home und Amazon Echo) (Apple Home Pod – Ist er wirklich 349€ wert?, 2018)

Produktinszenierung im Werbevideo der Firma Apple „Welcome Home“ (Welcome Home, 2018)

Die Bühne der Produktinszenierung ist ein Binnenraum, der nie in Gänze zu sehen ist. Es handelt sich um einen Raum, der mit einem Schreibtisch, einer Kommode und einem Bett wie ein WG-Zimmer eingerichtet ist. Auffällig ist die eher nüchterne, schmucklose Möblierung mit wenigen kleinen Topfpflanzen und die indirekte Beleuchtung des Schreibtisches, auf dem nur der Computer steht, und die Beleuchtung anderer Möbel in bunten, aber auch dezenten Farben, die an eine Unterbodenbeleuchtung getunter Fahrzeuge erinnert (Abbildungen 1 & 2). Das Zimmer wirkt spartanisch eingerichtet und unbewohnt. Diese aufgeräumte und leicht futuristisch anmutende Innenraumgestaltung wird ebenfalls in vielen anderen Videos unseres Samples eingesetzt.

Ebenso exemplarisch wie die Gestaltung des Binnenraums ist die Diskussion von Datenschutz und Privatsphäre in dem Video: Sie findet wie in vielen anderen Bewertungsvideos nicht statt und ist somit kein Test-Kriterium. Dies ist insofern relevant, als bei einem Review-Video die grundsätzlichere Bewertung des Geräts und nicht der erste Eindruck zum Thema gemacht wird. Hingegen wird von Falk neben dem schon im Titel erwähnten Preis vor allem das schöne Design, die Klangqualität und der Bedienkomfort des Geräts hervorgehoben. Negativ angemerkt wird die exklusive Einbindung des HomePod in die Apple-Produktwelt: Der HomePod sei nur sinnvoll mit einem iPhone und einem Apple-Music-Abonnement zu gebrauchen. Mit der Thematisierung der Funktionsweise und Einbettung in den Alltag zeigt sich der YouTuber ebenso als „online warm expert“ im Sinne von Neville (2021) wie auch in der direkten Ansprache.

Das Video endet mit einem Verweis auf einen Affiliate-Link in der Video-Beschreibung. Zwar wird in diesem Video auf die sonst übliche Bitte an das Publikum verzichtet, den Kanal zu abonnieren oder das Video zu liken, gleichwohl ist die Analyse des Kanals zum Verständnis des Videos und dessen Kontext geboten. Die Einbettung des Videos in den Kanal zeigt sich bereits darin, dass Gestaltungselemente der Kanal-Seite wie das Logo auch im Video als Wiedererkennungsmerkmal auftauchen. Das Video präsentiert sich nicht nur als typisches Exemplar einer Gattung von Review-Videos, sondern auch als Produkt einer anhand der eingestellten Videos nachvollziehbaren Professionalisierung und zugleich als (Selbst)-Thematisierung des YouTubers in seinen Clips.

4.2 Fallbeispiel II „Spiel und Zeug“

Scheint das eben beschriebene Video von „Techniklike“ die Beobachtung von Neville (2021) zu bestätigen, dass der Umgang mit Daten in der YouTube-Tech-Review-Kultur keine Rolle spielt, zeigt ein anderes Video aus unserem Sample, dass eine Auseinandersetzung mit dem Thema durchaus erfolgt. Es handelt sich dabei um ein Video, das weniger explizit auf den Test eines einzelnen Produkts, sondern auf eine grundsätzliche Erörterung des Themas Smart Living aus ist. Damit findet sich in diesem Kanal eine Trennung zwischen Testvideos einerseits und opinion pieces andererseits, ähnlich wie die Trennung zwischen Nachricht und Kommentar (respektive Meinung) im Nachrichtenjournalismus. Solche Videos sind zwar seltener als andere Unboxing- und Review-Videos, es finden sich aber allein mehrere in unserem Sample. Das Video „Siri oder Alexa oder Google Assistant – Vertrauen & Sicherheit im Smarthome“ wurde im März 2019 vom Betreiber des Kanals „Spiel und Zeug“, Andreas Dantz (Spiel-und-Zeug, 2019), hochgeladen. Dieser ist circa Mitte 30 und betreibt den Kanal seit 2014. Der YouTuber verfügt über 129.000 Abonnent:innen und seine insgesamt 247 Videos sind bislang 12,5 Millionen Mal aufgerufen worden (Stand Februar 2021). In seinen aktuellen Videos (zwischen 15 und 27 Minuten) testet er unter anderem Luftbefeuchter und smarte Türklingeln.

Das von uns analysierte Video greift einige Gestaltungselemente des ersten Fallbeispiels auf: Auch hier wird der/die Adressat:in direkt angesprochen und geduzt. Ein kurzer Teaser – „In der letzten Woche sind Dinge mit Amazon und Google passiert […], die in eine Kerbe schlagen, über die ich eh schon länger nachdenke […] und heute möchte ich meine Gedanken mit euch teilen“ (Min 0.00–0.12) – soll Neugier wecken und das Publikum zum Weitersehen verleiten. Zugleich macht Dantz schon zu Beginn deutlich, dass er kein objektives Urteil, sondern seine „Gedanken“ mitteilen möchte. Damit hat das Video immer noch Bezug zum persönlichen Erfahrungsraum des YouTubers; es stellt also keine von der Person abgehobene Einschätzung dar, wie sie sich etwa in Zeitungskommentaren findet.

Nach dem Einblenden eines animierten Logos, das auf den Kanal des YouTubers verweist, beginnt der Hauptteil des Videos. Im Bildausschnitt rückt der Sprecher näher als gewöhnlich an die Kamera heran. Der Blick des Protagonisten geht allerdings öfter etwas an der Kamera vorbei, gleichwohl wird eine Begegnung auf Augenhöhe suggeriert. Unterbrochen werden solche Einstellungen von eingespielten Sequenzen (Screens, die durchgescrollt werden oder Smart-Home-Produkte in Aktion), die eher illustrativen Charakter haben (Abbildung 4).

Produktinszenierung und YouTuber im Video des Kanals „Spiel und Zeug“ (Amazon Echo, Apple HomePod, Google Home) (Siri oder Alexa oder Google Assistant – Vertrauen & Sicherheit im Smarthome, 2019)

Viele Schnitte beim Sprechen und Continuity-Fehler heben die Semi-Professionalität der Videoproduktion hervor. Vermeintliche Fragen des Publikums, die eingeblendet werden, stehen für einen Perspektivwechsel und vereinnahmen bewusst die Adressat:innen. Ähnlich verhält es sich mit der Antizipation von Einwänden: „Und jetzt werden die Android-User sicherlich die Augen verdrehen und einige werden mich mit dem Titel Fan-Boy bewerfen …“ (Min. 6.05–6.10). Mit diesem rhetorischen Mittel versucht Dantz, die Kontrolle zu behalten und mögliche Gegenpositionen offenzulegen. Angedeutet wird aber auch seine Fehlbarkeit und Kritikfähigkeit. Unvermittelt wird stellenweise dezente Hintergrundmusik eingespielt. Dantz ist ein unaufgeregter, routinierter Sprecher, gibt sich sowohl ernst als auch humorvoll, übernimmt nicht unbedingt die Sprache der Insider oder Nerds. Seine Wortwahl ist bedächtig und demonstriert ein eher intellektuelles Niveau, was das Setting mit dicken Büchern im Hintergrund und einer eklektischen Auswahl an design- und gestaltungsbezogenen Objekten unterstreichen soll. Sein selbstironischer Unterton, der bei anderen YouTuber:innen oftmals fehlt, ist ein Distinktionsmerkmal. Alles in allem wirkt sein Auftreten deutlich souveräner als das von Jonas Falk, aber auch gewissermaßen belehrend.

Nahe Einstellung des YouTubers Andreas Dantz im Video des Kanals „Spiel und Zeug“ (Siri oder Alexa oder Google Assistant – Vertrauen & Sicherheit im Smarthome, 2019)

Dantz ist als Person in dem Video sehr präsent. Man sieht ihn zumeist in Nahaufnahmen, so dass Oberkörper und Kopf dominieren, Hände rücken nur bei Gesten ins Bild (Abbildung 5). Er ist mit einem schwarzen T-Shirt bekleidet und trägt eine markante dunkle Brille. Im Hintergrund befinden sich ein Regal und Gegenstände einfarbig angeleuchtet in Lila-, Blau- oder Grüntönen. Sie stehen im Kontrast zur Figur und dem Geschehen im Vordergrund. Größe und Einrichtung des Raums sind durch die vielen Nahaufnahmen nur zu erahnen. Auf diese Weise rücken die Person Dantz und damit auch seine Narration stärker ins Zentrum des Geschehens. Durch persönliche Narrationen, etwa über eigene Bedürfnisse und Befindlichkeiten sowie sein Selbstverständnis als YouTuber, wird Nähe zum Publikum aufgebaut. Auch in anderen Videos reflektiert er seine (Selbst-)Professionalisierung und seine Entscheidung, sein anfängliches Hobby zum Beruf gemacht zu haben. In den Thumbnails sind wie auch bei Jonas Falk bei fast jedem Video emotionalisierte Gesichtsausdrücke und Gesten zu finden. Dass der Kanal dabei selbst als Marke in den Vordergrund rückt, zeigt sich im angegliederten Web-Shop.

Im Gegensatz zu dem ersten Fallbeispiel erwähnt der Sprecher zu Beginn des Videos die „Datenskandale“ von Facebook und betont, dass sich ähnliche Datenpraktiken auch bei Amazon und Google und damit den Anbietern von Smart-Home-Technik finden lassen. So stellt er die These auf, dass Amazon durch den Kauf des Router-Herstellers eero in Zukunft alle internetbezogenen Aktivitäten in Haushalten über eben diese Router nachvollziehen und auswerten kann (Minute 0.42). Dies nimmt er zum Anlass diese Datenpraktiken selbst und ihre Einbettung in Vermarktungsstrategien zu diskutieren. Er suggeriert, dass ihm bei der Wahl eines Smart-Home-Systems der Datenschutz wichtiger als die Funktionalität ist, indem er fragt: „Wer stellt ein System her, dem ich vertraue?“ (Minute 2.00). Dieses Vertrauen sei bedeutsam, da durch die Fähigkeit der Smart Speaker, beständig zuzuhören und, je nach Ausstattung, auch Videos aufzuzeichnen, eine immer stärkere Verdatung und Analyse des häuslichen Alltags möglich sei. Dantz nimmt auf diese Weise auf die oben erwähnte Kritik an den Datenpraktiken Bezug. Der YouTuber betont dabei, dass er „keine wilden Szenarien“ erfinden würde. Er stellt sich als nüchternen und informierten Kunden dar, der sich seiner Interessen bewusst ist. Um seine Darstellung zu untermauern, werden zu konkreten Beispielen – etwa dem Verkauf von Wohnungskarten durch den Staubsaugerroboterhersteller Roomba – Online-Presseartikel eingeblendet (Minute 4.23). Dabei wird die Geschäftsstrategie, Geräte günstig zu verkaufen und die Nutzungsdaten nachträglich zu verwerten, zwar kritisiert, aber als Ergebnis des Marktdrucks gerechtfertigt. Problematisch scheint Dantz vor allem, dass die Datenauswertung klammheimlich vollzogen wird und nicht, dass sie überhaupt stattfindet (Minute 5.42). Er übernimmt damit gewissermaßen die Argumentation der Unternehmen, die sich anscheinend nur aus einem „Preiskampf“ (Minute 5.28) heraus zu der Datenverwertung gezwungen sehen. Apple wird dabei von dem YouTuber wegen seines Umgangs mit den Nutzer:innendaten gelobt, da die Firma nicht auf diese Strategie zu setzen scheint. So erwähnt er, dass Apple-Geräte die Kommunikation zwischen den Geräten so viel wie möglich ohne Zugriff auf externe Server operationalisiert (Minute 7.30). Für den YouTuber rechtfertigt dieser Umgang den vergleichsweise hohen Preis der Produkte. So räumt er schließlich ein, selbst primär Smart Speaker der Firma Apple zu verwenden. Das Video schließt mit dem Appell, sich dieser Datenpraktiken bei der Wahl eines Smart-Home-Systems bewusst zu sein, adressiert das Publikum also als kritische Verbraucher:innen. Dabei betont der Sprecher wiederholt, dass es sich um seine Meinung handelt, dass andere dieses Problem jedoch „anders angehen“ können.

Obwohl es also in einer dem Genre gemäßen Gestaltung und Narration um Smart Speaker geht, sticht das Video ob des Mangels eines konkret besprochenen Produkts aus dem Genre heraus. Dass es dennoch im Rahmen dieser Videos verortet werden kann, zeigt sich am Kanal des YouTubers. Der Betreiber des Kanals „Spiel und Zeug“ verfolgt durchaus ein mit dem von „Techniklike“ vergleichbares Konzept. Der humorige Unterton des hier besprochenen Videos findet sich dabei im Motto des Kanals – „Gadgets • Smartphone • Unfug – Jede Woche neue Videos“ – wieder.

5 Fokussierte Ergebnisdarstellung

In diesem Beitrag haben wir Review-Videos im Hinblick auf die ihnen eigene Ästhetik sowie Inszenierung der Datenpraktiken rund um Smart Speaker und jene der YouTuber:innen untersucht. Diese Aspekte sollen in diesem abschließenden Teil des Beitrags nicht zuletzt mit Bezug auf soziologische Debatten um diese Videos diskutiert werden.

5.1 Produkt- und Produktionsästhetik

Unsere Analysen haben gezeigt, dass die entsprechenden Videos nicht nur genrespezifische Produktionsästhetiken aufweisen, sondern diese auch in einem recht homogenen Rahmen einsetzen. Die Videos orientieren sich in ihrer Ästhetik zunehmend a) an zeitgenössischen filmischen Gestaltungsmitteln – indem Text eingeblendet wird, schnelle Schnitte vollzogen werden, die Sprecher:in stellenweise aus dem Off zu hören ist – sowie b) an der Werbeästhetik – dies zeigt sich unter anderem an der Verwendung des Bokeh-Effekts. Deren Einsatz erfordert jedoch ein gewisses technisches Können; die zunehmende Professionalisierung einiger YouTuber:innen zeigt sich also nicht nur im Hinblick auf den geschäftsmäßigen Umgang mit ihren Videos (Craig & Cunningham, 2017), sondern auch in der Produktion der Videos selbst. Die Kanäle der YouTuber:innen sind dabei als spezialisiert zu begreifen; mit Blick auf die Zahlen der Abonnements und der Aufrufe kann man davon ausgehen, dass die thematische Ausrichtung und die ästhetische Professionalisierung die Voraussetzung für Erfolg auf der Plattform sind. Die Kanäle greifen ein episodisches Serien-Format aus dem Fernsehen auf: Nicht nur sind die Videos eines Kanals mit dem gleichen Logo wie der Kanal versehen, auch erscheinen die Videos regelmäßig und widmen sich einem ähnlichen Thema. Sie sind in sich abgeschlossen, ihnen fehlt gleichwohl das Serienelement eines Cliffhangers.

Auf diese Weise leisten die hier untersuchten YouTuber kreative Arbeit, schöpfen aber nur bedingt Neues. Ihre Kreativität zielt nicht auf die Hervorbringung von Kunst, welche im Sinne moderner Ästhetik den Alltag transzendiert, sondern auf die Inszenierung von technischen Produkten, die als Anreiz dafür dienen, den Alltag ästhetisiert und reizvoll zu erleben (Reckwitz, 2013, S. 40). Dass sich die Videos in ihrer Struktur, in ihren Präsentationspraktiken in Bezug auf die Produkte sowie die YouTuber selbst und in ihren Inszenierungsbühnen ähneln, stellt offensichtlich kein Erfolgshindernis dar. Wie Wagner & Forytarczyk (2015) erläutern, orientieren sich die YouTuber:innen generell bewusst an Vorbildern, die ähnliche Inhalte wie sie selbst anbieten. Die neuen Reize in den Videos entstehen so nicht nur durch die formale Gestaltung, sondern sie werden durch die ständig erweiterten Gerätschaften und Dienste sowie die Überarbeitung ihrer Designs quasi mitgeliefert; sie finden sich somit in der Aktualität der Videos. Die Serialität der Videos zeigt sich damit in der immer wieder neuen Besprechung der jeweils neuesten Konsumtechnik.

Die Smart Speaker werden in aufgeräumten und jenseits von Topfpflanzen spartanisch eingerichteten Räumlichkeiten präsentiert, die steril und unbewohnt wirken, wie in einem Einrichtungshaus oder einem Serviced Apartment. Neben den in diesem Bereich meist männlichen YouTubern scheint die Technik die einzige ‚Mitbewohnerin‘ zu sein. Weder Partner:innen, noch Eltern, Kinder oder Haustiere werden in Szene gesetzt; es zählt einzig der individuelle Zugang zu und Umgang mit dem technischen Gerät. Hier wird eine andere ästhetische Strategie verfolgt als etwa von den Anbietenden der Geräte, welche die Smart Speaker häufig als Teil einer Interaktion mit mehreren Personen zeigen – z.B. in einem Werbe-Clip der Firma Google, die den Smart Speaker als Teil eines turbulenten und farbenfrohen Familienlebens im Einfamilienhaus präsentiert (Google, 2018). In den beiden YouTube-Videos schiebt sich, zugespitzt formuliert, die Inszenierung vom Wohnen mit Technik vor eine Thematisierung des tatsächlichen Lebens. Während Neville & Borkowski (o. J., im Erscheinen) die misogynen Kommentare zu den YouTube-Videos weiblicher Tech-Influencer diskutieren, die Verwendung der weiblichen Stimme in den Smart Speakern mit der negativen Charakterisierung der YouTuberinnen parallelisieren und so den sie verbindenden Sexismus herausarbeiten, spielt in den hier diskutierten Videos Weiblichkeit keine Rolle. Die präsentierten Geräte mit ihren weiblichen Stimmen bleiben in beiden analysierten Videos stumm. Damit fallen diese Videos hinter die Darstellung von Weiblichkeit und von Geschlechterverhältnissen in der Werbung zurück (vgl. zu Werbedarstellung von Smart Speakern Hennig & Hauptmann, 2019); so zeigt beispielsweise der zuvor erwähnte Google-Clip (Google, 2018) den Familienvater bei der Zubereitung des Abendessens und beide Elternteile als Spielpartner:innen der gemeinsamen Kinder. Während die Werbung auf diese Weise Elemente von häuslicher Reproduktionsarbeit aufgreift und Smart Speaker als technische Erleichterung bei solch zumeist eher weiblich konnotierten Arbeit präsentiert und insofern scheinbar demokratisiert (Chambers, 2020), wird dieser wesentliche Aspekt der partnerschaftlichen respektive familialen Lebensführung in den analysierten Videos der YouTuber ignoriert.

Die Videos transferieren nicht allein den Rat von Privatpersonen ins Digitale, sondern sorgen durch eine Ästhetisierung des Umgangs mit den Geräten dafür, diese nicht nur als praktisch, sondern als begehrenswert erscheinen zu lassen (Troullinou, 2017). Die Übernahme von Elementen der Werbeästhetik, die sich in beiden hier analysierten Videos findet, reproduziert nun zum einen die schon bestehende Ästhetisierung der Smart Speaker, welche durch die Budgets und die Prävalenz der großen Anbieter Apple, Google und Amazon in der Öffentlichkeit ohnehin präsent ist. Diese Produktästhetik wird nun aber in Bereichen einer scheinbar egalitären, de facto aber parasozialen Kommunikation zwischen YouTuber und Publikum aufgegriffen. Auffallend ist, dass die so entstehenden Nischenöffentlichkeiten – anders als Subkulturen, denen zumeist etwas von einer Gegenöffentlichkeit anhaftet – auch in der Gestaltung kaum von den dominanten ästhetischen Formen abweichen.

5.2 Inszenierung der YouTuber

Anders als die Moderator:innen von Wissens- und Verbrauchermagazinen im Fernsehen geraten die YouTuber nicht nur als Sprechende in den Fokus, sondern sie zeigen sich in unseren beiden Fällen als Privatperson. So hat Jonas Falk schon früh das wiederkehrende Format „Frag Jonas“ etabliert, in welchem er Fragen zu seiner Person beantwortet, die ihm über verschiedene Plattformen (wie etwa Instagram) gestellt werden. Der Werdegang und der soziale Aufstieg des YouTuber werden hier als Thema in einer Art und Weise aufgegriffen, wie dies auch bei Kandidat:innen in Casting-Shows systematisch betrieben wird. Neu ist hier allerdings, dass die YouTuber nicht nur sich selbst, sondern auch die technische Ausstattung für ihre Videoproduktionen thematisieren und How-Tos dazu erstellen. So erläutert Jonas Falk etwa den Umzug in ein mit anderen YouTubern betriebenes Studio und die dort verwendete Technik und Raumausstattung (Techniklike, 2022). Andreas Dantz beschreibt in seinen Videos sein Geschäftsmodell und seine Entscheidung, sich mit seinem YouTube-Kanal selbstständig gemacht zu haben. Ein weiteres Video aus dem Genre (Think-Media, 2020) gibt Hinweise dazu, wie man ein gutes Review-Video produziert, das sich auch finanziell rentiert. Die Videos thematisieren damit den Kanal und den/die Betreibenden selbst und legen nahe, dass das Publikum ein Interesse an dieser Form von Transparenz und Selbstdarstellung habe.

Glaubwürdigkeit und Authentizität versuchen die YouTuber in ihren Videos über Personalisierung zu erzeugen. So empfiehlt ein Video für angehende YouTuber:innen, eine vielleicht bestehende Idiosynkrasie bewusst zu einem Erkennungszeichen und Alleinstellungsmerkmal auszubauen (MissNici, 2017). Damit verkörpern YouTuber:innen des Unboxing- und Review-Genres den Sozialtypus des Kreativen – vielleicht nicht par excellence, sondern eher als ein „beruflich-ökonomisches Phänomen“ (Reckwitz, 2010, S. 256). Sie demonstrieren sich als unternehmerisches Selbst (Bröckling, 2007; Geimer & Burghardt, 2017) und stellen dabei ihre beruflichen ebenso wie ihre konsumtorischen, vermeintlich privat-persönlichen Praktiken nach außen dar. En passant machen sie ebenso Werbung für einen Lebensstil des über YouTube plattformisierten Selbstständigen und damit vermittelt auch Werbung für die Plattform YouTube, die einen solchen Lebensstil erlaubt und fördert.

5.3 Bewertung und Kritik von Smart-Speaker-Datenpraktiken

Die Praktiken der YouTuber:innen sind in der Regel jedoch nicht nur reine Selbstdarstellung. Sie werden in den von angeführten Nischenöffentlichkeiten verhandelt, in denen allerdings kaum konträre Positionen aufeinander bezogen werden. Der Mangel an Deliberation findet sich auch in den Videos der Reviewer selbst. So werden die Bewertungen anderer YouTuber:innen nicht erwähnt. Jedes Video steht mit seiner Einschätzung für sich. Damit greifen die Videos eine Bewertungskultur auf, die sich in Magazinen für Produktbewertungen niederschlägt. Auch dort werden zwar die Produkte im Test mit anderen Geräten verglichen, die Tests selbst beziehen sich aber nicht auf die Tests von anderen. In den Videos haben die Bewertungen nun die Besonderheit, dass sie weniger als objektives Urteil, denn als persönliche Empfehlung oder als Meinung dargestellt werden. Im Gegenzug wird dem Publikum explizit eine eigene Bewertung des Gegenstands zugestanden, wenn nicht gar abverlangt. YouTuber:innen äußern Interesse daran, diese Bewertungen in den Kommentaren zu lesen. In den Videos selbst werden diese Kommentare aber nur selten aufgegriffen. Die Rahmung der Bewertung als Meinung eines Amateurs – im Sinne eines Liebhabers sowie eines nicht professionell ausgewiesenen Bewerters – hat, so kann man mit Verweis auf Adornos Diskussion des Zusammenhangs in „Meinung – Wahn – Gesellschaft“ (Adorno, 1997) herausarbeiten, zwei Funktionen: Zum einen relativiert der Bezug auf die bloße Meinung die Äußerung, zugleich wird sie affektiv besetzt und kann damit noch verstärkt werden. Wie sich in der Diskussion der ‚Diskursbereinigung’ durch YouTuber:innen und Fans von Beauty-Unboxing-Videos zeigt (vgl. Wagner & Forytarczyk, 2015), wird die Kritik am Video zugleich als Kritik an der Person der YouTuber:in verstanden. Zugleich stellen die Unboxing- und Review-YouTuber:innen ihre „kritischen Kompetenzen“ (Boltanski & Thévenot, 1999) unter Beweis, da sie die Funktionen der Geräte nicht unhinterfragt lassen oder die Kompatibilität verschiedener Geräte und Systeme besprechen und vor allem die Tauglichkeit im Alltag in den Blick nehmen.

Dabei bleiben jedoch etliche Aspekte ausgespart: So erzeugen Smart Speaker in Teilen der Bevölkerung durchaus im Hinblick auf die Datenpraktiken Misstrauen oder gelten schlicht als unpraktisch (Lau et al., 2018). Das Für und Wider der Implementierung der Geräte in den privaten Haushalt wird in den Videos nicht grundsätzlich besprochen. Problematisch geltende Aspekte, wie die ökonomische Verwertung der Audiodaten als Trainingseinheiten für die jeweilige KI sowie der infrastrukturelle Aufwand und der Ressourcenverbrauch, der für das Funktionieren der Geräte unabdingbar ist (Crawford & Joler, 2018), werden meist nicht thematisiert – dies ist in Formaten wie „Stiftung Warentest“ jedoch inzwischen selbstverständlich (Primus, 2017).

Anders ist dies in dem analysierten Video von Andreas Dantz (Spiel-und-Zeug, 2019), da hier die kommerziellen Datenpraktiken als Teil eines problematischen Geschäftsmodells kritisiert werden. Der YouTuber ordnet Smart Speaker als Teil einer umfassenden, kommerziellen Überwachung ein. Die Reaktion darauf ist jedoch keine grundsätzliche Kritik kommerzieller Datenpraktiken. Als Umgang mit dem Problem wird dem Publikum lediglich eine Abwägung zwischen dem Anschaffungspreis der Konsumtechnik und dem Risiko der Datenpreisgabe nahegelegt. Dantz stellt somit weder die Notwendigkeit des Einsatzes von Smart Speakern in Frage, noch erscheint in dem Video ein Umgang jenseits einer individuellen Kaufentscheidung möglich. Für Dantz ist es selbstverständlich, sich den technischen Entwicklungen anzupassen. Sein Video ist dahingehend paradigmatisch für die von uns untersuchten Videos, in denen immer nur in Frage steht, welcher Smart Speaker anzuschaffen ist und nie, ob es überhaupt sinnvoll ist, einen solchen zu verwenden. Weder ist in dieser Perspektive eine individuelle Abstinenz noch eine kollektive und damit politische Reaktion auf geltendes Recht oder gar ein Internet, das nicht von Oligopolen beherrscht wird, vorstellbar (vgl. Fuchs & Unterberger, 2021).

6 Schlussbetrachtung

Während die zwei analysierten Videos exemplarisch verdeutlichen, wie sich die verwendete Ästhetik nur geringfügig von kommerziellen Inszenierungen der Smart Speaker unterscheidet, bzw. wie die YouTuber versuchen diese zu imitieren, zeigen sich die YouTuber auf der inhaltlichen Ebene durchaus kritikfähig, in dem sie die Smart Speaker auf ihre Alltagstauglichkeit hin untersuchen und damit anders operieren als Werbe-Clips, die zwangsläufig auf eine Kaufempfehlung hinauslaufen. In dem die Tech-YouTuber auf diese Praktikabilität fokussieren, bleiben jedoch die ökonomischen, infrastrukturellen und plattformisierten Bedingungen dieser alltäglichen Nutzung der Sprachsteuerung und der Smart-Home-Vernetzung weitgehend außen vor. Und wie das zweite Fallbeispiel zeigt, lässt sich die kritische Berichterstattung über kommerzielle Datenpraktiken ebenfalls auf die alltagspraktisch relevante Frage herunterbrechen, welchem Anbieter von Smart Speakern man eher vertrauen soll.

Die Inszenierungen der beiden YouTuber, ihrer Geräte und ihrer vermeintlichen Wohnräume verweisen auf eine zugleich futuristische und in den Alltag eingebundene Ästhetik, in welcher der Smart-Speaker-Einsatz als kreatives und nerdiges Herumbasteln und zuweilen als Teil eines luxuriösen Lifestyles wirkt. Smart Speaker werden als selbstverständlicher Teil eines modernen, plattformbezogenen und technikaffinen Lebensstils präsentiert (Srnicek, 2018). Die hier vorgestellten YouTuber fungieren als Wegbereiter und Fürsprecher von Smart-Home-Technologien, deren Voraussetzung die automatisierte Überwachung des Wohnraums ist. Neville (2021, S. 1296f.) kritisiert in diesem Zusammenhang, dass die YouTuber:innen in den Unboxing-Videos etwa die Datenschutzrichtlinien der Smart Speaker nicht diskutieren und so zu der Erzeugung einer „seductive surveillance“ (Troullinou, 2017) beitragen. Diese Kritik greift jedoch insofern zu kurz, da die Nichtbeachtung dieser Dokumente bei der Verwendung digitaler Dienste allgegenwärtig ist (Obar & Oeldorf-Hirsch, 2020) und nicht spezifisch für die vorliegenden Videos. Die Videos emulieren gewissermaßen den Rat, den vermutlich auch ein nicht online, sondern persönlich bekannter „warm expert“ Interessierten geben würde. Denn auch dieser „warm expert“ hat sich für den Kauf solcher Geräte entschieden und nimmt damit die Datenpraktiken der Anbieter, den Ressourcenverbrauch und weitere mögliche problematische Aspekte in Kauf. Dies zeigt sich exemplarisch am hier diskutierten zweiten Fallbeispiel, dem Video von Andreas Dantz. Die Videos richten sich implizit an Technikinteressierte und damit an eine Nischenöffentlichkeit, die solche Aspekte ebenso zugunsten der Techniknutzung vermutlich vernachlässigt. Anhand dieses Falls lässt sich argumentieren, dass die Videos die Überwachung nicht ausblenden – im Gegenteil zeigt sich Dantz über zum Zeitpunkt der Veröffentlichung noch gar nicht implementierte technische Möglichkeiten informiert –, sondern dass sich der YouTuber im Bewusstsein dessen für das Versprechen von Komfort und digitaler Servilität entscheidet. Nils Zurawski hat die in den Videos präsente Inszenierung von „Modernität, Distinktion und Domestiken“ (Zurawski, 2021, S. 46) treffend als „Konsum der Überwachung“ beschrieben. Dass es sich hier um diesen „Konsum der Überwachung“ handelt, zeigt sich somit sowohl auf der Ebene des Inhalts wie jenem der Form. Die Videos suggerieren eine Selbstverständlichkeit der Smart-Speaker-Nutzung und damit eine Selbstverständlichkeit der Auswertung personenbezogener Sprachdaten aus dem häuslichen Bereich durch kommerzielle Akteure. Zugleich wird das Publikum durch die Videos nicht nur über technische Neuheiten informiert, sondern ebenso unterhalten – und zwar auf andere Weise, als dies in Testberichten in Textform der Fall wäre. Gerade die personenbezogene Serialität könnte als Erklärung für den relativen Erfolg der Review-Videos dienen. Als Motivation für das Betrachten der Videos kommt somit nicht nur ein Interesse an Smart Speakern in Betracht, sondern ein Interesse an der Person des YouTubers und der Gestaltung der Videos selbst.

Zugleich werden die Videos von den YouTubern als ein Mittel verstanden, um auf YouTube erfolgreich zu sein. Sie scheinen damit die Videos als ein Mittel zum Zweck des eigenen Erfolgs zu erzeugen. Damit stehen sie selbst in einem instrumentellen Verhältnis zum Inhalt der Videos, die immer auch Werbung für die YouTuber beziehungsweise ihre Online-Persona sind. Da dies von den YouTubern transparent gemacht wird, kann man davon ausgehen, dass das Publikum diese Vermischung von Unterhaltung und Aufklärung (Göttlich, 2017) als eine solche ebenso instrumentell und damit nüchtern rezipiert. Genaue Analysen über die Motivation und Praktiken des YouTube-Schauens in Bezug auf Unboxing- und Review-Videos liegen bisher nicht vor. Sie wären wohl notwendig, um das Konzept der Nischenöffentlichkeit noch besser konturieren und weiterentwickeln zu können.

7 Danksagung

Für die Mitarbeit bei den Recherchen und Analysen möchten wir uns bei den studentischen Mitarbeitenden Miriam Müller, Mirlinda Arifi und Alexander Martin und für die Durchsicht des Manuskripts bei Aileen Halbe herzlich bedanken. Des Weiteren möchten wir uns bei den Gutachtenden für die konstruktiven und wertvollen Hinweise bedanken.

Datenverfügbarkeit

Die Daten zu diesem Beitrag werden in einem universitätsnahen Repositorium abgelegt, das sich im Aufbau befindet, https://fodasi.e-science-service.uni-siegen.de. Die Liste der analysierten Videos inkl. Links kann durch die Autor:innen zur Verfügung gestellt werden.

Finanzierung

Gefördert wird diese Untersuchung durch die Deutsche Forschungsgemeinschaft (DFG) – Projektnummer 262513311 – SFB 1187.

Interessenskonfliktstatement

Die Autor:innen erklären, dass keine potenziellen Interessenskonflikte bestehen.

Literatur

Adorno, T. W. (1997). Meinung, Wahn, Gesellschaft. In Gesammelte Schriften Bd. 10.1 (S. 573–594). Frankfurt am Main: Suhrkamp.

Bakardjieva, M. (2005). Internet Society: The Internet in Everyday Life. London: Sage.

Baur, N. & Lamnek, S. (2017). Einzelfallanalyse. In L. Mikos & C. Wegener (Hrsg.), Qualitative Medienforschung. Ein Handbuch (2. Auflage, S. 290–300). Wiesbaden: Springer VS.

Boltanski, L. & Thévenot, L. (1999). The Sociology of Critical Capacity. European Journal of Social Theory, 2(3), 359–377.

Boltanski, L. & Thévenot, L. (2007). Über die Rechtfertigung. Eine Soziologie der kritischen Urteilskraft. Hamburg: Hamburger Edition.

Bröckling, U. (2007). Das unternehmerische Selbst. Soziologie einer Subjektivierungsform. Frankfurt am Main: Suhrkamp.

Chambers, D. (2020). Domesticating the „Smarter Than You“ Home. Medien & Kommunikationswissenschaft, 68(3), 304–317.

Couldry, N. & Mejias, U. A. (2019). Costs of Connection: How Data Is Colonizing Human Life and Appropriating It for Capitalism. Stanford: Stanford University Press.

Craig, D. & Cunningham, S. (2017). Toy unboxing: living in a(n unregulated) material world. Media International Australia, 163(1), 77–86.

Crawford, K. & Joler, V. (2018). Anatomy of an AI System. The Amazon Echo As An Anatomical Map of Human Labor, Data and Planetary Resources. AI Now Institute, Share Lab. Zugriff am 9.12.2019. Verfügbar unter: http://www.anatomyof.ai/img/ai-anatomy-publication.pdf

Fries, P. J. (2018). Influencer-Marketing: Informationspflichten bei Werbung durch Meinungsführer in Social Media. Wiesbaden: Springer.

Frühbrodt, L. & Floren, A. (2019). Unboxing Youtube. Im Netzwerk der Profis und Profiteure. OBS-Arbeitshefte Nr. 198. Frankfurt am Main: Otto Brenner Stiftung.

Fuchs, C. & Unterberger, K. (2021). The public service media and public service internet manifesto. London: University of Westminster Press. https://doi.org/10.16997/book60

Geimer, A. (2018). YouTube-Videos und ihre Genres als Gegenstand der Filmsoziologie (Springer Reference Sozialwissenschaften). In A. Geimer, C. Heinze & R. Winter (Hrsg.), Handbuch Filmsoziologie (S. 1–14). Wiesbaden: Springer VS. https://doi.org/10.1007/978-3-658-10947-9_95-1

Geimer, A. & Burghardt, D. (2017). Normen der Selbst-Disziplinierung in YouTube-Videos: Eine Analyse von Varianten der Nachahmung von professionellen Lifehack- und Transformation-Videos in Amateur-Videos. Sozialer Sinn, 18(1), 27–56.

Gillespie, T. (2010). The politics of „platforms“. New Media & Society, 12(3), 347–364. https://doi.org/10.1177/1461444809342738

Google. (2018). Family Time With Google Home. Verfügbar unter: https://www.youtube.com/watch?v=b3aNcfExpE4

Göttlich, U. (2017). Öffentlichkeit durch Unterhaltung. Krise der Öffentlichkeit oder Herausforderungen der Öffentlichkeitstheorie? In K. Hahn & A. Langenohl (Hrsg.), Kritische Öffentlichkeiten – Öffentlichkeiten in der Kritik (S. 115–132). Wiesbaden: Springer VS.

Habermas, J. (1990). Zum Strukturwandel der Öffentlichkeit. Untersuchungen zu einer Kategorie der bürgerlichen Gesellschaft. Frankfurt am Main: Suhrkamp.

Hennig, M. & Hauptmann, K. (2019). Alexa, optimier mich! KI-Fiktionen digitaler Assistenzsysteme in der Werbung. Zeitschrift für Medienwissenschaft, 11(2), 86–94.

Jonze, S. (2018). Welcome Home. Apple. Zugriff am 15.2.2021. Verfügbar unter: https://www.youtube.com/watch?v=70P7-pkyP4Q

Kessous, E. (2015). The Attention Economy Between Market Capturing and Commitment in the Polity. Oeconomia, 5(1), 77–101.

Kropf, J. & Laser, K. (2019). Eine Bewertungssoziologie des Digitalen. In S. Laser & J. Kropf (Hrsg.), Digitale Bewertungspraktiken. Für eine Bewertungssoziologie des Digitalen. (S. 1–19). Wiesbaden: Springer VS.

Lamont, M. (2012). Toward a Comparative Sociology of Valuation and Evaluation. Annual Review of Sociology, 38, 201–221.

Lau, J., Zimmerman, B. & Schaub, F. (2018). Alexa, Are You Listening? Privacy Perceptions, Concerns and Privacy-seeking Behaviors with Smart Speakers. Proceedings of the ACM on Human-Computer Interaction, 2(CSCW), 102:1–102:31. https://doi.org/10.1145/3274371

Mikos, L. (2015). Film- und Fernsehanalyse (3., aktualis. Aufl.). Konstanz: UVK.

MissNici. (2017). Mit YouTube Anfangen? Anfänger Tipps für YouTube. Zugriff am 15.2.2021. Verfügbar unter: https://www.youtube.com/watch?v=WTdUY6YEw1U

Moser, S. J. & Schlechtriemen, T. (2018). Sozialfiguren – zwischen gesellschaftlicher Erfahrung und soziologischer Diagnose. Zeitschrift für Soziologie, 47(3), 164–180.

Mowlabocus, S. (2020). ’Let’s get this thing open’: The pleasures of unboxing videos. European Journal of Cultural Studies, 23(4), 564–579. https://doi.org/10.1177/1367549418810098

Neville, S. J. (2021). The domestication of privacy-invasive technology on YouTube: Unboxing the amazon echo with the online warm expert. Convergence, 27(5), 1288–1307. https://doi.org/10.1177/1354856520970729

Neville, S. J. & Borkowski, A. (o. J.). Broken domestication: The resonant politics of voice in gendered technology. In M. Hartmann (Hrsg.), The Routledge handbook of media and technology domestication. London: Routledge.

Nyomen, O. & Schmitt, W. M. (2021). Influencer. Die Ideologie der Werbekörper. Berlin: Suhrkamp.

Obar, J. A. & Oeldorf-Hirsch, A. (2020). The Biggest Lie on the Internet: Ignoring the Privacy Policies and Terms of Service Policies of Social Networking Services. Information, Communication & Society, 23(1), 128–147.

Phua, J. & Pfeuffer, A. (2022). Stranger danger? Cue-based trust in online consumer product review videos. International Journal of Consumer Studies, 46, 964–983. https://doi.org/https://doi.org/10.1111/ijcs.12740

Potthast, J. (2017). The Sociology of Conventions and Testing. In C.E. Benzecry, M. Krause & I.A. Reed (Hrsg.), Social Theory Now (S. 337–360). Chicago: Chicago University Press.

Pridmore, J., Zimmer, M., Vitak, J., Mols, A., Trottier, D., Kumar, P. C. et al. (2019). Intelligent personal assistants and the intercultural negotiations of dataveillance in platformed households. Surveillance & Society, 17(1), 125–131. https://doi.org/10.24908/ss.v17i1/2.12936

Primus, H. (2017). Die Stiftung Warentest. In P. Kenning, A. Oehler, L.A. Reisch & C. Grugel (Hrsg.), Verbraucherwissenschaften. Rahmenbedingungen, Forschungsfelder und Institutionen (S. 525–542). Wiesbaden: Springer VS.

Prommer, E., Wegener, C. & Linke, C. (2022). Von Männern und ‚Beauty‘ auf YouTube. Die ungleichen und rückständigen visuellen Geschlechterrollen in Webvideos. In U. Autenrieth & C. Brantner (Hrsg.), It’s all about Video. Visuelle Kommunikation im Bann bewegter Bilder (S. 132–154). Köln: Herbert von Halem Verlag.

Reckwitz, A. (2010). Der Kreative. In S. Möbius & M. Schroer (Hrsg.), Diven, Hacker, Spekulanten. Sozialfiguren der Gegenwart (S. 248–260). Berlin: Suhrkamp.

Reckwitz, A. (2013). Die Erfindung der Kreativität. Zu Prozess gesellschaftlicher Ästhetisierung. Berlin: Suhrkamp.

Reichelt, P. & Hegemann, L. (2019, Oktober 18). Alexa, hörst du grad zu? Zeit online. Zugriff am 17.1.2020. Verfügbar unter: https://www.zeit.de/digital/datenschutz/2019-09/smart-speaker-amazon-echo-google-home-daten/komplettansicht

Silverstone, R., Hirsch, E. & Morley, D. (1992). Information and communication technologies and the moral economy of the household. In R. Silverstone & E. Hirsch (Hrsg.), Consuming technologies: Media and information in domestic spaces (S. 13–28). London: Routledge.

Spiel-und-Zeug. (2019). Siri oder Alexa oder Google Assistant – Vertrauen & Sicherheit im Smarthome. Zugriff am 15.2.2021. Verfügbar unter: https://www.youtube.com/watch?v=cY5IQV7mXA8

Srnicek, N. (2018). Plattform-Kapitalismus. Hamburg: Hamburger Edition.

Strübing, J. (2014). Grounded Theory und Theoretical Sampling. In N. Baur & J. Blasius (Hrsg.), Handbuch Methoden der empirischen Sozialforschung (S. 457–472). Wiesbaden: Springer VS.

Techniklike. (2018). Apple Home Pod – Ist er wirklich 349€ wert? Zugriff am 15.2.2021. Verfügbar unter: https://www.youtube.com/watch?v=0dCYP9I8vCQ

Techniklike. (2022). Das Ende von unserem Studio.... Zugriff am 19.1.2023. Verfügbar unter: https://www.youtube.com/watch?v=mdaB2tYQbKs

Think-Media. (2020). How to Create a Product Review Video (That Actually Gets Views!). Zugriff am 15.2.2021. Verfügbar unter: https://www.youtube.com/watch?v=8SiRTLIXSzE

Troullinou, P. (2017). Exploring the Subjective Experience of Everyday Surveillance: The Case of Smartphone Devices as Means of Facilitating »Seductive« Surveillance. Dissertation. The Open University. Verfügbar unter: http://oro.open.ac.uk/52613/

Turow, J. (2021, September 12). Hear That? It’s Your Voice Being Taken for Profit. The New York Times. Zugriff am 12.9.2021. Verfügbar unter: https://www.nytimes.com/2021/09/12/opinion/voice-surveillance-alexa.html

Unbox.IT: Unboxing Ceremony of Nokia E61. (2006).. Zugriff am 13.1.2023. Verfügbar unter: https://youtu.be/uJAYO0gxpdY

Wagner, E. & Forytarczyk, N. (2015). Gute Kopien: Nutzungspraktiken von Hauling-Videos auf YouTube und die Entstehung moralischer Nischenöffentlichkeiten. kommunikation @ gesellschaft, (16), 1–24.

Waldecker, D. & Volmar, A. (2022). Die zweifache akustische Intelligenz virtueller Sprachassistenten zwischen verteilter Kooperation und Datafizierung. In A. Schürmer, M. Haberer & T. Brautschek (Hrsg.), Acoustic Intelligence. Hören und Gehorchen (S. 161–182). Düsseldorf: Düsseldorf University Press. Verfügbar unter: https://doi.org/10.1515/9783110730791-011

West, E. (2022). Buy Now. How Amazon Branded Convenience and Normalized Monopoly. Cambrige, MA: The MIT Press.

Zuboff, S. (2018). Das Zeitalter des Überwachungskapitalismus. Frankfurt/New York: Campus.

Zuboff, S. (2019). Surveillance Capitalism – Überwachungskapitalismus. Aus Politik und Zeitgeschichte, 69(24), 4–9.

Zurawski, N. (2021). Überwachen und Konsumieren. Kontrolle, Normen und soziale Beziehungen in der digitalen Gesellschaft. Bielefeld: transcript.

Damit knüpfen die Videos an Werbestrategien an, welche auf Mund-zu-Mund-Propaganda setzen. Generell ist aus der Konsumforschung bekannt, dass die mündliche Kommunikation von per se gleichwertigen Personen von den Empfänger:innen der Nachricht als weniger kommerziell wahrgenommen wird, da sie dem Anschein nach nicht direkt von den Werbetreibenden bereitgestellt wird (Phua & Pfeuffer, 2022).↩︎
14 Review- und Unboxing-Videos (davon alle bis auf eines deutschsprachig), fünf Werbe-Clips, vier Erklärvideos der Anbieter, sowie vier How-To-Videos für angehende YouTuber:innen.↩︎
Beide YouTuber haben mehr als 50.000 Abonnements und über eine Million Ansichten der geposteten Videos. Damit befinden sie sich am oberen Ende der deutschsprachigen Tech-Influencer in unserem Feld. Im Sample befanden sich auch weniger intensiv bespielte Kanäle, die bspw. nur um die 460 Abonnements und über ca. 2.500 Aufrufe des analysierten Videos verfügten.↩︎