Wieso eigentlich Alexa?

Konzeptualisierung eines Sprachassistenten als Infrastruktur und Plattform im soziotechnischen Ökosystem Amazons

  • Niklas Strüver ORCID logo SFB 1187 Medien der Kooperation, Universität Siegen

DOI:

https://doi.org/10.15460/kommges.2023.24.1.1194

Schlagworte:

Sprachassistenten, Alexa, Amazon, Künstliche Intelligenz, Plattform, Infrastruktur, Science and Technology Studies, Techniksoziologie

Redaktion und Begutachtung

  • Susanne Oechsner ORCID logo Universität Klagenfurt
  • Jan-Hinrik Schmidt ORCID logo Leibniz Institute for Media Research | Hans-Bredow-Institut (HBI)

Abstract

In diesem Artikel wird der Sprachassistent Alexa vor dem Hintergrund des Plattformökosystems Amazons untersucht. Hierzu werden Elemente der Plattform- und Infrastrukturtheorie verwendet, um die Rolle des Assistenten in Relation zu den anderen Plattformen der Firma zu konzeptualisieren. Diese Betrachtung ermöglicht es Alexa zum einen als Daten-, Entwicklungs- und Testinfrastruktur von Künstlicher Intelligenz für Amazon und zum anderen als Komfort-Infrastruktur für Nutzer:innen zu betrachten. Um das Wechselverhältnis dieser beiden Rollen nachzuvollziehen, wird ein iteratives Modell entwickelt, welches den Entwicklungsprozess von Alexa als Technologiekomplex nachvollzieht. Die Erkenntnisse, die in der Genese dieses Modells gewonnen werden können, eignen sich dazu den Sprachassistenten als Plattform und Infrastruktur im Plattformökosystem Amazons zu situieren und herauszuarbeiten, welchen Nutzen der Assistent für Amazon haben kann. Dieses letzte Argument trägt zur Weiterentwicklung des theoretischen Instrumentariums zur Betrachtung von Plattformen bei, als dass es diese als wandelbare relationale Infrastrukturen in einem Plattformökosystem begreift, deren Rollen sich im Laufe der kontinuierlichen Entwicklung verändert.

1 Einleitung

Sprachassistenten sind mittlerweile in vielen Haushalten zu finden und werden von Nutzer:innen oft als Unterhaltungsquelle und Organisationstool im Alltag genutzt. Trotz der Popularität von intelligent personal assistants (IPA)1 wie Alexa, meldet Marktführer Amazon Probleme in der Entwicklung und Monetarisierung der Geräte. Das Einkaufen über Alexa ist nicht sonderlich populär (Ammari, Kaye, Tsai & Bentley, 2019, S. 23) und ein Sprachassistent, der mit Werbedurchsagen auf die Bitte einen Timer zu stellen reagiert, verfehlt den Zweck der angepriesenen Zeitersparnis und Bequemlichkeit (Strengers & Nicholls, 2017), sodass Produzenten von Sprachassistenten die Haupteinnahmequellen des Sektors (Srnicek, 2017, S. 40ff.) verwehrt bleiben. Ausgehend von diesen Problemen und befeuert von personellen Konsequenzen, die Amazon aus ihnen gezogen hat (Kim, 2022), lässt sich fragen, zu welchem Zweck Amazon den Sprachassistenten betreibt.

Hierzu soll eine Analyse des soziotechnischen Komplexes um Alexa und Amazon durchgeführt werden, die sich auf Elemente der Plattform- und Infrastrukturtheorie (Plantin, Lagoze, Edwards & Sandvig, 2018) stützt, um den IPA und seine (hintergründige) Einbettung in Amazons Plattformökosystem (Dijck, 2020) aufzuzeigen. Besonders angesichts der Tatsache, dass Alexa an das häusliche Internet of Things (IoT) anknüpft, lohnt eine relational-techniksoziologische (Häußling, 2017) Betrachtung des Sprachassistenten und der Logiken der involvierten Technologien, um Amazons Verwendung für Alexa und die political economy des IoT (Goulden, 2021) zu untersuchen. Ein zentrales Analysemoment ist die Rolle Alexas im Kontext der Entwicklung Künstlicher Intelligenz (KI). Zur Untersuchung dieses Verhältnisses wird ein iteratives Modell zur Entwicklung von KI-Technologien im Falle Alexas – mit einer potenziellen Anwendung auf ähnliche Technologien – vorgestellt. Im Zuge der Erarbeitung des Modells wird dargelegt, wie Alexa als Daten-, Entwicklungs- und Testinfrastruktur für Amazon und zur Komfort-Infrastruktur für Nutzer:innen und Firmen wird. Anhand dieser Momente lässt sich die Rolle von Alexa als Plattform und Infrastruktur in Beziehung zu Amazons Plattformökosystem nachvollziehen und anschließend in Srnicek (2022) Argument der Verschiebung der zentralen Antriebskräfte (von Datenmengen zu Entwicklungskapazitäten) im Wettbewerb um KI einordnen. Der IPA kann somit als Element der Technologieentwicklung in Amazons Plattformökosystem verstanden werden, was eine abschließende theoretische Reflektion und Weiterentwicklung der Wechselwirkung von infrastrukturalisierten Plattformen (Edwards, 2021) und ihren Plattformökosystemen – auch im Hinblick auf künstliche Intelligenz – ermöglicht. Letztlich kann durch das relationale Verständnis des Sprachassistenten in Beziehung zum Plattformökosystem Amazons ein Einblick in die Rolle Alexas für Amazon gegeben werden. Um diese Analyse zu ermöglichen, wird zunächst ein Überblick über relevante Forschungsliteratur gegeben.

2 Sprachassistenten in der Forschung

Die Erforschung von Sprachassistenten wird in vielen Disziplin betrieben, welche teils gegenseitig von Ergebnissen und Erkenntnissen profitieren können. Dieser Literaturüberblick konzentriert sich daher auf Aspekte, die für die daran anschließend präsentierten Argumente von Relevanz sind, und orientiert sich dabei weniger an strengen Disziplingrenzen.2

Zunächst ist es wichtig zu verstehen, wozu und wie IPA im Haushalt genutzt werden. Die alltagsnahe Erforschung der Anwendung von Sprachassistenten (z.B. Fischer, Reeves, Porcheron & Sikveland, 2019), kann u.a. eine Verständnisbasis für dafür liefern, welche dedizierten Sprachroutinen Nutzer:innen entwickeln (Porcheron, Fischer, Reeves & Sharples, 2018), was von Reeves, Fischer, Porcheron & Sikveland (2019) als „learning how to talk“ bezeichnet wird. Quantitative Ansätze, die Nutzungsdaten von IPA analysieren, zeigen bspw., dass die meistfrequentierten Anwendungen Musik, Smarthome-Steuerung und Suchanfragen sind (Ammari et al., 2019, S. 10). Studien von Lopatovska et al. (2019) und Strengers, Hazas, Nicholls, Kjeldskov & Skov (2020) haben verschiedene Use Genres von Sprachassistenten z.B. für Bequemlichkeit, Wohlgefühl, Smarthome-Organisation oder Unterhaltung identifiziert. Betrachtet man Sprachassistenten als Medientechnologie (Hector, 2023), kann herausgearbeitet werden, wie IPAs in einem Domestizierungsprozess in die Nutzungspraktiken des Haushalts eingebettet werden können (Neville, 2020; Waldecker & Hector, 2023; Waldecker & Hoffmann, 2023). Während IPAs auch als Internet-Interface, mit spezifischen der Sprachsteuerung geschuldeten Eigenschaften (Soffer, 2020), z.B. als Suchmaschine (Natale & Cooke, 2020), oder als Informationsquellen zur (politischen) Bildung (Ojeda, 2021; Weidmüller, Etzrodt, Löcherbach, Möller & Engesser, 2021), betrachtet werden können, spricht West (2022, S. 128ff.) hingegen von Alexa als Technologie, die möglichst reibungslosen Konsum ermöglichen soll, was Karppi & Granata (2019, S. 874) als konzeptionelle Engführung Alexas auf den E-Commerce bemängeln.

Um IPAs als Plattform und Infrastruktur zu verstehen, ist es hilfreich sie im Kontext des Internet of Things (IoT) betrachten, da sie eine Vielzahl ihrer Funktionen durch den Verbund zu verschiedenen Geräten und Diensten erhalten und somit im Kontext des Smarthomes (z.B. Goulden, 2019; Dahlgren, Pink, Strengers, Nicholls & Sadowski, 2021; Hine, 2019) zu situieren sind. Laut verschiedenen Studien (Dahlgren et al., 2021; Hargreaves, Wilson & Hauxwell-Baldwin, 2018; Humphry & Chesher, 2021; Strengers & Nicholls, 2017) wird dem Smarthome (besonders vor der Integration von IPA) oft eine komplizierte Einrichtung und Bedienung zugeschrieben, wodurch es derzeit eher als eine Zukunftsvision gilt (Sadowski, 2020, S. 114f.), sowohl aus Sicht der Nutzer:innen als auch der Journalist:innen. IPA-Hersteller werben jedoch oft mit der Rolle von Sprachassistenten als verbindendes Element zwischen Smarthome-Technologien, was Nutzung erleichtern soll, jedoch auch eine Engführung auf die Geschäftslogiken der jeweiligen Herstellerfirmen herbeiführt (Goulden, 2021; Strüver, 2023). Als zentrale Anlaufpunkte im Haushalt (Wang, Luo & Wang, 2023, S. 13f.) stehen Sprachassistenten also in konstanter Verbindung zu anderen Geräten und Firmen auf häuslicher (Brause & Blank, 2020) und globaler (Crawford & Joler, 2018) Ebene. So können Abhängigkeiten von Sprachassistenten ökonomischer (European-Commission, 2022), politischer (Goulden, 2021), oder soziotechnischer (Strüver, 2023) Natur für Hersteller von Smarthome-Geräten und Kund:innen entstehen.

Diese zentrale Position der Hersteller von Sprachassistenten als Plattform des Smarthomes ist besonders unter dem Aspekt der Datensammlung zu betrachten, welcher eine wichtige Rolle im Geschäftsmodell dieser Firmen spielt. Das Erheben von Daten in der Nutzung als Kerneigenschaft smarter Geräte (Sadowski, 2020), findet auch bei Sprachassistenten Anwendung (Natale & Guzman, 2022). Diese Erfassung und der Umgang der Nutzer:innen damit, wird im Zuge der Erforschung von Privatsphäre und Datensicherheit besonders bei Sprachassistenten kritisch betrachtet (Brause & Blank, 2023; Lau, Zimmerman & Schaub, 2018; Maalsen & Sadowski, 2019; Mols, Wang & Pridmore, 2021; Pridmore & Mols, 2020; Sadowski, Strengers & Kennedy, 2021; Waldecker & Volmar, 2022). So bestehen Sorgen etwa bezüglich der Handlungsmacht der Nutzer:innen (Waldecker, Hector & Hoffmann, 2023) oder der Verwendung der Interaktionsdaten z.B. im Rechts- (Zurawski, 2021, S. 44) Immobilien- oder Versicherungswesen (Sadowski, 2020, S. 101–120). Die Datenerhebung über Nutzer:innen durch Sprachassistenten und die weitere Verwertung dieser Daten wird gerade vor Amazons Hintergrund des Onlinehandels und der Werbeindustrie von staatlichen Akteuren im Kartellrecht zum Schutz der Nutzer:innen beobachtet (Deutscher-Bundestag, 2019; European-Commission, 2022, S. 32–53; Nadler & Cicilline, 2020, S. 16, 126).

Auch wenn also Studien zur Nutzung von Sprachassistenten vorliegen, die die problematische Rolle als datensammelnde Technologie im Privathaushalt im Kontext des IoT analysieren, steht eine detaillierte soziotechnische Untersuchung der Funktionsweisen und Bedeutung von Sprachassistenten in Beziehung zu anderen Technologien und Diensten noch aus. Die hierfür wesentliche analytische Perspektive Sprachassistenten als Plattform in einem Plattformökosystem zu begreifen, ist ebenfalls bislang wenig erforscht. Die Rolle des Sprachassistenten Alexa für Amazon, Drittanbieter und Nutzer:innen soll vor diesem Hintergrund beleuchtet werden, um die von Crawford und Crawford & Joler (2018) angestoßene Perspektive von Alexa als soziotechnisches Netzwerk um neue Perspektiven zu erweitern. Hierfür bedarf es zunächst der Erläuterung einiger theoretischer Mittel.

3 Sprachassistenten als Plattform und Infrastruktur

Um ein Verständnis für die Bedeutung von Alexa für Nutzer:innen, Amazon und Drittanbieter zu gewinnen, werden Aspekte der Plattform- und Infrastrukturtheorie etabliert, um sie anschließend auf Alexa anzuwenden. Plattformtechnologien und die damit einhergehenden Geschäftsmodelle stellen mittlerweile den Kern vieler Silicon Valley-Firmen wie Amazon dar (Mühlhoff, 2018, S. 564; Srnicek, 2022, S. 242f.). Um einen Überblick darüber zu erlangen, welche Motive, Interessen und Vorstellungen die Entwicklung von IPA und Smarthome-Geräten und letztlich ihre intendierte Verwendung leiten, ist ein Verständnis für die Umgebung nötig, in der Sprachassistenten entwickelt werden. Die Plattform als wissenschaftliches Konzept wird in der sozial- und geisteswissenschaftlichen Literatur aus verschiedenen Blickwinkeln diskutiert (z.B. Srnicek, 2017; Dolata, 2019; Gillespie, 2018). Allen Perspektiven gemeinsam sind einige Kernaspekte der Operationslogiken von Plattformen. Vereinfacht betrachtet ist die Funktion einer Plattform, dass sie zwei oder mehreren Akteursgruppen eine digitale Infrastruktur zur Verfügung stellt, auf der interagiert werden kann (Srnicek, 2017, S. 43). Die konkrete Implementierung dieser Funktion kann von Firma zu Firma und von Produkt zu Produkt unterschiedlich sein (Gillespie, 2018, S. 20), jedoch eint alle Plattformen der Versuch, multiplizierende Netzwerkeffekte (bspw. mehr Funktionen, was zu mehr Nutzer:innen führt, was wiederum zu mehr ökonomischen Ressourcen zur Produktion von mehr Funktionen führt) in einem großen soziotechnischen System herzustellen (Dijck, 2013, S. 14). Eine klassische, eher informatische Definition versteht Plattformen als programmierbare Infrastrukturen, die eine Basis für das Entwickeln anderer Softwareprogramme darstellen (Baldwin & Woodard, 2008). Diese Technologien stellen die Grundlage für andere Parteien bereit, um weitere Anwendungen und Endgeräte anschließen zu können. Eine Plattform besteht in dieser Definition aus einer invariablen Menge von Kernkomponenten (Herstellerseite), welche mit variablen Komplementärkomponenten (Drittanbieter) erweitert werden können (Plantin et al., 2018, S. 294ff.). Hieran zeigt sich bereits, dass Plattformtechnologien die Verbindungen zu anderen Parteien inhärent sind.

Digitale Technologien werden von Plattformorganisationen eingesetzt, um soziotechnische Prozesse zu strukturieren und zu koordinieren. Diese Konzeption der Beziehung zwischen den Firmen legt nahe, dass Plattformen nicht lediglich rein neutral den Austausch zwischen zwei Parteien ermöglichen, sondern durch das Bereitstellen einer spezifischen Konfiguration von Code die sozialen Interaktionen auf der Plattform formen (Dijck, 2013, S. 29). Durch diese inhärente Anschlussfähigkeit von Plattformen ist es Amazon, Google und Co. gelungen, verschiedene Lebensbereiche der Nutzer:innen zu kommodifizieren und zu monetarisieren. Ein Großteil des ökonomischen Gewinns schlagen diese Firmen aus dem Geschäft mit (personalisierter) Werbung (Srnicek, 2017, S. 40ff.). Da große Firmen wie Amazon mehrere Plattformen gleichzeitig anbieten, können sie über Querfinanzierung bzw. -subventionierung Gewinne einer Plattform für den Betrieb und die Entwicklung anderer Plattformen und Technologien nutzen. Ein Beispiel im Fall Amazon sind der Onlinehandel und das Verkaufen von Werbeanzeigen auf Amazon.com, die die Entwicklung von Alexa mitfinanzieren. Neben Einnahmen aus dem Werbegeschäft wird das Anbieten von Clouddiensten als mietbare Rechen- bzw. Speicherkapazität (ebd., S. 60-64) und zunehmend auch zur Nutzung und Entwicklung von Anwendungen im KI-Bereich (Srnicek, 2022) genutzt. Amazons Unternehmenszweige als unabhängige Produktlinien zu begreifen, würde aufgrund starker Interdependenzen die Firmenstruktur nicht adäquat beschreiben (Khan, 2018, S. 104). Entsprechend ist es essenziell, den Hintergrund des Plattformökosystems, also der „assemblage of networked platforms“ (Dijck, 2020, S. 2804), zu sehen. Weiterhin sind es besonders solche infrastrukturellen Momente von Plattformen, wie das Bereitstellen essenzieller Dienste für andere Firmen, die einige Plattformen elementar für die Nutzung des modernen Internets werden lassen. Dadurch können Plattformtechnologien an kritischen Stellen des Internets platziert werden, um Wachstum und Entwicklung zu gestalten, was einen Effekt auf den Alltag von Nutzer:innen und Firmen haben kann.

In diesem Sinne lässt sich von einer Infrastrukturalisierung von Plattformen sprechen, welche den Prozess der Zentralisierung von Plattformen im alltäglichen Leben beschreibt (Plantin et al., 2018, S. 294–301). Um das Wechselverhältnis von Plattform und Infrastruktur im Falle Alexas zu untersuchen, wird der Infrastrukturbegriff der Science and Technology Studies (z.B. Bowker & Star, 2000, S. 37) verwendet, um zu beleuchten, wie Plattformen zu zentralen alltäglichen Infrastrukturen werden und welche Implikationen damit einhergehen können. Dadurch sollen die Wirkweisen und Konstitutionsbedingungen von nur scheinbar hintergründigen und unsichtbaren Infrastrukturen aufgedeckt werden. Infrastrukturen (und in der hier verfolgten Lesart auch Plattformen) sollen so nicht als einzelne Technologien mit festen Eigenschaften betrachtet werden, sondern vielmehr als Menge von Relationen, bestehend aus Standards, Artefakten und (administrativen) Handlungsabläufen, wodurch auch soziale Konventionen, technische Gegenstände und organisationale Institutionen als Teile von Infrastruktur gefasst werden können (Star & Ruhleder, 1996, S. 113). Slota & Bowker (2017) fassen relationale Infrastrukturen wie folgt zusammen:

“It is embedded and transparent; infrastructure exists (metaphorically) within or underneath other social, technological, and built worlds and does not need to be reconsidered at the moment of each task it enables. Infrastructure is learned as a part of membership in a given community and linked with the conventions of practice therein and embodies some set of standards. It is built above an installed base, becomes visible upon breakdown, and is of a scale or scope that exceeds a single ‘site’” (2017, S. 537).

Dieser Definitionen entsprechend, soll Alexa im Folgenden als Infrastruktur hinterfragt werden. Da es sich bei Alexa um eine Plattformtechnologie handelt, rückt hier in den Fokus, wie und wann die Plattform infrastrukturelle Beziehungen herstellt, ganz im Sinne der Frage when - und nicht what - is an infrastructure (Star & Ruhleder, 1996, S. 112f.). Im Folgenden wird dementsprechend aufgezeigt werden, in welche Beziehungen Alexa als Plattformtechnologie verwickelt wird, für wen und was sie in welcher Form als Infrastruktur fungiert und welche Konsequenzen diese Beziehungen für die involvierten Parteien haben. Die Relationen zwischen Alexa, anderen Plattformen, Herstellern, Nutzer:innen und externen Firmen rücken somit in den Vordergrund, da die Plattform als Infrastruktur beobachtbare Beziehungen herstellt: “the question is not whether a given thing is in essence an infrastructure but when it is an infrastructure. There is no system that is inherently infrastructural; there are only observed infrastructural relationships” (Slota & Bowker, 2017, S. 531, Hervorhebung im Original). So kann Alexa als Infrastruktur für Nutzer:innen möglichst unsichtbar in der Praxis verschwinden, für Ingenieur:innen bei Amazon als Zugang zu Daten- und Entwicklungstechnologien, oder als Basis für andere Amazonprodukte als Sprachinfrastruktur fungieren. Bei der Analyse dieser infrastrukturellen Beziehungen von Plattformen wird ein Augenmerk auf ihre eingeschriebenen Logiken gelegt werden, da „in information infrastructure, every conceivable form of variation in practice, culture, and norm is inscribed at the deepest levels of design“ (Star, 1999, S. 389). Den Effekt dieser Logiken in den infrastrukturellen Beziehungen aufzuzeigen weist letztlich auf die Macht hin, die Firmen wie Amazon zukommt, da sie ein hohes Maß an Kontrolle über die Ausrichtung von Technologien haben, welche von einer Vielzahl von Menschen tagtäglich genutzt werden.

Die Einordnungen verschiedener Aspekte von Alexa als Plattform oder Infrastruktur sind hierbei nicht trennscharf, da beide Konzepte (in dieser Lesart) stark aufeinander aufbauen. Dieser Mangel an Trennschärfe wird weiterhin von der Vielfältigkeit soziotechnischer Entitäten verstärkt, die in das Plattformökosystem involviert sind. Jedoch können durch die Verschränkung beider Perspektiven theoretische Kernkonzepte weiterentwickelt und die Rolle Alexas für Amazon erkundet werden.

4 Alexa im Plattformökosystem Amazons

Im Folgenden sollen verschiedene Aspekte Alexas kritisch durch die Perspektive der Plattform und Infrastruktur betrachtet werden. Um diese Perspektive zu ermöglichen, wird zunächst ein kurzer Überblick über die Kernelemente Amazons Plattformökosystem gegeben (4.1). Darauf aufbauend wird ein Modell entwickelt, das Alexas Rolle darin erläutert und in Bezug zur Entwicklung von Technologie und KI setzt (4.2).

4.1 Kernelemente Amazons Plattformökosystems

Bevor die Einbettung Alexas in Amazons Plattformökosystem und daraus resultierende potenzielle Synergien für Amazon aufgezeigt werden, fokussiert das nachfolgende Kapitel zunächst drei Kernsäulen Amazons hinsichtlich ihrer Vernetztheit als Plattform und Infrastruktur im Produktkatalog. So können Parallelen zu Alexa gezogen und ein Verständnis dafür entwickelt werden, wie Amazon Technologien von Grund auf miteinander verbindet, was als Kernstrategie der Firma gesehen werden kann (Rowberry, 2022, S. 27ff.). Der Onlinehandel auf Amazon.com, Cloudservices per Amazon Web Services (AWS) und das Treueprogramm Prime werden als die Säulen Amazons beschrieben (Bezos, 2016) und durchziehen die gesamte Produktpalette Amazons:

AWS als Cloudinfrastruktur wird einerseits als Dienstleistung für (Betriebs-)Kunden angeboten und andererseits werden nahezu alle amazoninternen Dienste ebenfalls über AWS abgewickelt (Bessen, 2022, S. 156). Wie viele Plattformen entstand AWS aus einem spezifischen internen Nutzen und war ursprünglich das logistische Netzwerk, um den Onlinehandel Amazon abzuwickeln (Srnicek, 2017, S. 61). Entsprechend dieses Ursprungs ist AWS immer noch die Basis für Amazons E-Commerce und Werbeplattform. Auch die hochtechnologisierten Warenhäuser Amazons basieren auf AWS Technologien – seien es Roboter, die Regale bewegen (West, 2022, S. 67–72), oder Arbeiter:innen, die von der AWS-Bilderkennungssoftware Rekognition unterstützt Waren aus Regalen nehmen sollen (Beverungen, 2021, S. 187f.): AWS ist die zentrale Infrastruktur Amazons. Geräte wie Echo oder der E-Bookreader Kindle funktionieren lediglich durch die AWS Cloud-Infrastruktur, da sie nur so mit wenig Rechenkraft ausgestattet werden müssen und über die Cloudanbindung einen Zugriff auf Amazons Dienste erhalten (Rowberry, 2022, S. 31ff.). AWS bietet ebenfalls die Speicherinfrastruktur für Prime Video und Music (West, 2022, S. 163). Diese Menge an infrastrukturellen Verbindungen innerhalb von Amazon bedeutet einen konstanten Strom an Weiterentwicklungen für AWS-Technologien. Diese interne Infrastruktur wird schließlich auch als mietbare Infrastruktur für (Firmen-)Kund:innen angeboten, wodurch Amazon die für interne Zwecke entwickelten Produkte weiterhin monetarisieren kann.3 So bietet sich Amazon als Infrastruktur für alle Internetplattformen an: „For a sector addicted to outsourcing fixed costs, server power for hosting was one of the few it was stuck with. That is, until AWS came along“ (Harris, 2023, S. 522). Neben der ohnehin oligopolistischen Struktur des Cloudmarkts (Dolata, 2019, S. 192), sei auch kritisch auf die materiellen Gegebenheiten von Clouds hingewiesen. Sie sind mitnichten, wie von Amazon propagiert, konsequenzlos expandierende, unsichtbare Internetinfrastrukturen, sondern haben gravierende Auswirkungen auf Umwelt und Arbeitnehmer:innen (Ensmenger, 2021, S. 43–46).

Für die E-Commerce-Plattform wurde eine Vielzahl an Technologien entwickelt und patentiert, die für (sichere) Transaktionen im Internet nötig sind, welche sich entsprechend auch in Amazons anderen Produkten wiederfinden, in denen Produkte oder Dienste gekauft werden können. Die Onlinehandelsplattform stellt sichere Bezahlungswege bereit und fungiert ebenso als Entwicklungs- und Einsatzort für Algorithmen der Katalogisierung (Weigel, 2023, S. 12–16), des Suchens und Empfehlens (Ricci, Rokach & Shapira, 2015) sowie schließlich zur Übernahme der Verkäuferauswahl durch den Buy-Box-Algorithmus: „Each time a consumer clicks on a product, Amazon chooses a single seller from all the vendors offering that product to display as the featured offer in the ‚Buy Box’“ (Nadler & Cicilline, 2020, S. 249). Hierdurch erhält Amazon ein hohes Maß an Kontrolle über die Auswahl des Verkäufers eines Produkts4 und simplifiziert den Kaufprozess für Kund:innen (ebd., S. 281-284, 325-329). Dieser Auswahlprozess und die hintergründigen Datenströme bleiben für Kund:innen und Drittanbieter weitgehend opak. Der Marketplace als Multi-Sided Market (Amazon, Kunden und Drittanbieter) bündelt so Logistik und Plattform für verschiedene Kundenarten und ist in die Produktpalette breit integriert (Bessen, 2022, S. 170–176). Kernfunktionen des einfachen Einkaufens und reibungsloser Transaktionen finden sich in fast allen Diensten Amazons in abgewandeltem Formen wieder; so auch in Alexa, wo die Auswahl von Produkten und Medien noch undurchsichtiger ist. Durch gebrochene und undurchsichtige Transaktionsinfrastrukturen kann Amazon im E-Commerce letztlich Machtpositionen ausbauen und Konditionen für ganze Branchen zu diktieren (Pascal, 2023; Weigel, 2023).

Prime erfüllt als Treueprogramm den Zweck Kund:innen auf der Plattform zu halten und dort den Konsum zu steigern (Khan, 2018, S. 750–754). Bot Prime zunächst nur Boni im Onlineshopping sowie Versand an, wurde es im Laufe der Entwicklung auf Premiumdienste im Streaming von Livestreams (Twitch), Filmen und Serien (Prime Video), sowie Musik (Prime Music) erweitert. Diese Bereiche in Prime zu integrieren, zeigt die starke Anbindung an AWS als Cloud für Streamingdienste aller Art (West, 2022, S. 163) und an die Amazon.com Website als zentrale Anlaufstelle für Prime Video und Music: „By encouraging users to see Amazon’s ecosystem as an interconnected suite of services, Prime has become central to the company’s business-to-consumer offerings. In this sense, Prime functions as a service infrastructure, offering a common base for consuming Amazon services that discourages users from moving to another platform. The subscription service permeates all parts of Amazon“ (Rowberry, 2022, S. 42). Prime fungiert letztlich als Zugang zu Amazons abgeschwächter Version eines walled gardens (Plantin et al., 2018, S. 301–304), der Zugang zu den Diensten Amazons bietet und Kund:innen dazu verleitet sich im Plattformökosystem aufzuhalten. Auch dies kann wieder dazu führen, dass Monopoltendenzen durch steigende Netzwerkeffekte verstärkt werden, als dass Nutzer:innen weniger nach Alternativen zur Amazon Produktpalette suchen müssen.

Anhand der Kernsäulen Amazons zeigt sich bereits, dass Amazon ein Multiplattformunternehmen ist, welches Synergien zwischen den eigenen Diensten herstellt (West, 2022, S. 84). Vor diesem Hintergrund kann Alexa als Technologie mit ähnlich hohen Vernetzungsgrad in der Plattformökologie Amazons betrachtet werden.

4.2 Rollen und Verbindungen Alexas im Plattformökosystem Amazons

Für die meisten Plattformen findet die Monetarisierung durch das Verkaufen von Werbeflächen an andere Firmen statt. Ein Sprachassistent, der anstatt auf eine gestellte Anfrage zu reagieren kurz einen Werbeslogan abspielt, scheint jedoch das Versprechen von Komfort und Effizienz zu brechen. Nutzer:innen tätigen kaum Einkäufe über den Assistenten (Ammari et al., 2019, S. 23) und Alexa verbucht seit Jahren ausschließlich ökonomische Verluste (Kim, 2022). Entsprechend lässt sich fragen, zu welchem Zweck Amazon Alexa betreibt. Die These der folgenden Ausführungen ist, das Alexa als Plattform und Infrastruktur im Hintergrund kritische Entwicklung und Einbindungen für die Firma ermöglicht, die nicht unbedingt augenscheinlich sind. Alexa basiert auf einer globalen technischen Infrastruktur, die aus einer Vielzahl von Technologien wie z.B. Serverfarmen, Tiefseekabel, Satelliten, Knotenpunkten und schließlich den Echo-Geräten und Geschäftsmodellen besteht. Um ein Funktionieren der Echo-Geräte in Interaktion5 zu garantieren (Hector, 2023, S. 221f.), bedient Amazon sich verschiedener Technologien und Infrastrukturen, die sowohl firmenintern, als auch durch externe Anbieter (z.B. Internet Service Provider, Rechenzentren, Websites, Smarthome-Geräte) bereitgestellt werden. Auf amazoninterner Seite sind z.B. die Vielzahl der verschiedensten Knotenpunkte zu nennen, die für die Verarbeitung von Sprachkommandos, Ausführen von Skills und Beantwortung von Fragen nötig sind. Des Weiteren laufen Dienste Alexas (wie alle Amazon Produkte) über verschiedene AWS-Cloudinstanzen, was AWS zur notwendigen Verbindung Alexas macht. In diesem Sinne ist jede Anfrage an Alexa eine Anfrage an ein großes globales Netzwerk, das reibungslos funktionieren muss, um die Interaktion zu garantieren (siehe Crawford & Joler, 2018). Alexa ist somit auf einer heterogenen Basis von soziotechnischen Komplexen errichtet, die sich in konstanter Entwicklung und Anpassung befindet. Diese Zusammensetzung ist ein Anknüpfungspunkt, um die Rolle Alexas für Amazon zu konzeptualisieren. Die folgende Analyse unterscheidet und illustriert dazu vier Situationen, in denen Alexa als Infrastruktur betrachtet werden kann (4.2.1 bis 4.2.4) und eine allgemeine Einordnung des Vorgestellten in die Logiken moderner Datenverarbeitung (4.2.5). Diese Aspekte werden anhand eines Kreislaufmodells (Abbildung 1) illustriert, welches sowohl ein analytisches Ergebnis der Untersuchung als auch eine Orientierungshilfe darstellt.

4.2.1 Echo als Daten-Infrastruktur

Ein schon fast klassisches Argument für die Rentabilität von Plattformen ist das Sammeln von Daten. Hiermit scheinen besonders die großen Firmen zu rechtfertigen, dass Technologien keinen direkten Monetarisierungspfad bieten und dass erst zunächst Daten auf Halde gespeichert werden, um aus ihrer Analyse in Zukunft Wert zu ziehen (Fourcade & Healy, 2017, S. 13). So legt auch Amazon einen gesteigerten Wert auf die Generierung und Erfassung von Daten als Quellen des Profits. Daten sind in diesem Sinne weniger immaterielle, abstrakte Konstrukte, als vielmehr konkrete Informationen sowohl über das Privatleben der Nutzer:innen (Sadowski, 2020, S. 31) als auch über Produkte und organisationale Abläufe anderer Firmen (Khan, 2018, S. 117ff.). Anfallende Nutzungsdaten werden analysiert, um Profile der Nutzer:innen zu erstellen, die unter anderem das Konsumverhalten abbilden können (Munn, 2020). So werden anhand von Daten – die in Interaktion der Nutzer:innen mit den verschiedenen Plattformen entstehen – Muster über diese herausgestellt, welche die moderne Werbeindustrie monetarisieren kann (Srnicek, 2017, S. 50–60). Durch die Erstellung solcher Muster ist es möglich, Nutzer:innen in verschiedene Kategorien zu sortieren, welche Werbetreibende anfragen können. So könnte bspw. ein Verkäufer von starker Sonnenschutzcreme bei Amazon um die Werbeschaltung der eigenen Produkte bitten und besonders Nutzer:innen mit heller Haut und einem Interesse an Reisen fokussieren. Amazon bringt Käufer:innen von Werbeflächen und Käufer:innen von Sonnencreme zusammen und bietet vermeintlich lediglich die Interaktionsplattform. Nutzer:innen sind jedoch durch die Interaktion mit den Plattformen gleichzeitig die Produzent:innen der Daten, die solche Kategorisierungen ermöglichen.

Daher ist es nicht verwunderlich, dass Plattformen versuchen mehr Daten verschiedener Arten und Quellen zu erfassen und speichern, indem sie Nutzer:innen möglichst an das eigene Plattformökosystem binden (Gillespie, 2018, S. 19ff.): Oberflächlich gesehen ist Alexa als Mittel der Informationsgewinnung für Amazon in die interne Plattformlandschaft eingebunden. Das Beispiel der Werbung für Sonnencreme kann dies illustrieren, da Reisen in der Regel nicht über Amazon gebucht werden und somit außerhalb der klassischen Geschäftsreichweite des Unternehmens liegen. Anhand der Kombination verschiedener Datenquellen lassen sich dennoch entsprechende Rückschlüsse ziehen: Vorherige Käufe von Produkten (über Amazon.com, oder die Einkaufszettelfunktion Alexas), gemeinsam mit Videodaten von Echo Geräten mit Kamera oder IoT-Geräten, könnten nahelegen, dass Personen besonders empfindliche Haut haben. Im nächsten Schritt haben besagte Personen Alexa in den letzten Wochen möglicherweise nach Informationen zu bestimmten Ländern oder dem nächsten Reisebüro gefragt und die Informationen von Alexa in einer Liste organisieren lassen, oder einen Reminder erstellt. Die Kombination dieser Informationen ermöglicht das gezielte Schalten von Werbung für Hautpflegeprodukte. Weil Alexa durch Skills (der Name für Apps in Alexa) und IoT-Geräte an diverse Lebensbereiche anknüpft, lassen sich alltägliche Handlungen, die sonst auf verschiedene Geräte, Applikationen und Einrichtungen verteilt sind, in Alexa bündeln und für Amazon lesbar machen. So können detailliertere Profile von verschiedenen Lebensbereichen der Nutzer:innen und aggregierten Nutzungsmustern (Munn, 2020, S. 276) erstellt werden, welche in Algorithmen und Technologien einfließen und aus diesen nach der Entwicklung nicht herausgefiltert werden können (Thylstrup, Hansen, Flyverbom & Amoore, 2022). Der verfolgte Imperativ der Datenbeschaffung (Fourcade & Healy, 2017, S. 13) zur Stillung des intraorganisationalen Bedürfnisses nach höheren Datendichten ist in diesem Sinne eine selbstverstärkende Schleife, denn „smart tech not only demands constant flows of data to operate, it is also the machinery for manufacturing the universe of data“ (Sadowski, 2020, S. 35). Um zu erklären, wie diese Maschinerie im Falle von Alexa funktioniert, wird im Folgenden ein Modell6 (Abbildung 1), entwickelt, welches die Analyse der (sich wiederholenden) verketteten Prozesse ermöglicht. Das vorgestellte Modell ist – entgegen der Darstellung – nicht vom Rest Amazons abgekapselt. Im Gegenteil, ähnlich den Querstreben zwischen den drei etablierten Säulen Amazons (Marketplace, AWS und Prime), sind in den dargestellten Schritten des Modells die Verbindungen in die Plattformökologie explizit mitzudenken. Die nachfolgenden Abschnitte gehen jeweils auf die einzelnen Momente des Modells (fett hervorgehoben) ein und erklären deren Interdependenzen. Einleitend wird zunächst auf Mechanismen aus der generellen Entwicklung von Algorithmen und Plattformen eingegangen.

Kreislaufmodell des Alexa-Ökosystems

4.2.2 Alexa als Entwicklungs-Infrastruktur für KI

Zunächst lässt sich allgemein sagen, dass Sprachassistenten, wie die meisten modernen Plattformtechnologien, zu einem großen Teil auf der stetigen Weiterentwicklung und Verbesserung von Machine Learning Algorithmen7 (und dadurch letztlich auch der Geräte) basieren. Im 2016er Jahresbericht Amazons beschreibt Bezos die Erfolge der praktischen Anwendungen von Machine Learning (ML), die Amazon verbucht, und hebt darunter auch besonders Alexa hervor. Direkt im Anschluss gibt er eine aufschlussreiche Auskunft über Amazons Verhältnis zu Machine Learning:

„But much of what we do with machine learning happens beneath the surface. Machine learning drives our algorithms for demand forecasting, product search ranking, product and deals recommendations, merchandising placements, fraud detection, translations, and much more. Though less visible, much of the impact of machine learning will be of this type – quietly but meaningfully improving core operations.“ (Bezos, 2017)

Diese Einschätzung ist tongebend für die Implementierung Alexas in Amazons Plattform- und Logistikökosystem und spielt im Folgenden eine maßgebliche Rolle, weswegen eine kurze Erklärung der Funktionsweise dieser Algorithmen nötig ist: ML wird meist als Methode zum Programmieren komplexer Algorithmen verwendet. Sie werden häufig auf besonders großen Datensätzen eingesetzt, in denen sie bestimmte Muster identifizieren. Anhand dieser Muster werden Funktionen erstellt, die zur Identifizierung von Eigenschaften im Datensatz führen: „What this means is that machine learning is a generative process that creates knowledge from the patterns and functions available in data. Machine learning algorithms are thus defined in large part by their iterative relationships to the ‘examples’ they are exposed to in a world of data“ (Amoore, 2023, S. 21). Weiterhin stellt Kitchin (2017) für Big Data-Datensätze fest, dass sie nicht nur eine große Menge Daten haben, sondern auch möglichst vollständig, bzw. den Phänomenbereich erschöpfend, divers und akkurat sein sollten. Da die meisten in der Plattformtechnologiebranche verwendeten Algorithmen auf eben solchen Datenbeständen basieren, trifft diese Beobachtung auch im Fall von ML bei Sprachassistenten zu. Diese Beziehung von ML-Algorithmen zum Grunddatensatz (Trainingsbasis) ist insofern wichtig, als sie die Basis für das Anwenden von Algorithmen auf neue unbekannte Daten (Zielanwendung) ist. Ein breit aufgestellter, detailreicher und vielfältiger Trainingsdatensatz führt (so die Hoffnung) dazu, dass der Algorithmus mit größerer Wahrscheinlichkeit auch in der Anwendung auf unbekannte Daten korrekte Ergebnisse liefert (Jaton, 2021). Weil das Programmieren durch ML quasi ein Industriestandard für Plattformunternehmen geworden ist (Srnicek, 2022, S. 242f.), benötigen die so agierenden Firmen für die Entwicklung und Verbesserung ihrer Geräte und Dienste meist eine große Menge an diversen Datenpunkten. Das Zusammenstellen einer Datenbasis zum Trainieren von Algorithmen ist keine einmalige Angelegenheit, da Algorithmen anhand im laufenden Prozess gesammelter Daten aktualisiert werden (Burrell & Fourcade, 2021, S. 221f.). Vor diesem Hintergrund lässt sich der Datensammelimperativ (Fourcade & Healy, 2017, S. 13) nachvollziehen, nach dem Firmen daran interessiert sind, immer mehr und vielfältigere Datenquellen zu akquirieren und entsprechende Technologien zu entwickeln (Sadowski, 2019, S. 2), „to render the setting capable of data capture, analysis, and feed-back“ (Marres & Stark, 2020, S. 436). Offensichtliche Anwendungen von ML im Falle IPAs sind Algorithmen für Speech Recognition, Natural Language Understanding, Text to Speech, oder die Anpassung an Nutzer:innen durch Vorschläge (Reccomender Systems) (Bessen, 2022, S. 176). ML-Produkte wie Amazons Lex und Polly bieten die Möglichkeit, die Speech-to-Text und Text-to-Speech Funktionen, die Alexa antreiben, über simple Schnittstellen-Anbindungen anzusteuern und zu verwenden (Bezos, 2017). Firmenintern können diese dann für andere Produkte genutzt werden wie z.B. das AWS-Telefonkonferenzsystem mit Transkriptionserweiterungen Amazon Chime, die automatische Audioausgabe von E-Books auf dem Kindle, das automatische Aufbereiten von Produkt-FAQs auf dem Marketplace durch Alexa (Amazon, 2022), oder als Hilfe für Arbeiter:innen in Amazons Warenhäusern (Delfanti & Frey, 2021, S. 17f.), um die enorm hohen Ansprüche an Effizienz an Arbeiter:innen zu durchzusetzen bzw. zu erzwingen (Harris, 2023, S. 525f.). Neben diesen internen Anwendungen werden Polly und Lex ebenfalls direkt als Dienstleistung für andere Firmen angeboten, die sie in eigene Produkte integrieren können (Bezos, 2017).

An diesen Beispielen lässt sich nachvollziehen, wie Amazon die Entwicklungen im Rahmen Alexas strategisch einerseits mit der eigenen Produktpalette verbinden und andererseits als Dienstleistung vermarkten kann. In beiden Fällen wirken die Alexa-Technologien als Infrastruktur für die Sprachfunktionalitäten der jeweiligen Anwendung. Die Bedeutung und Funktion von Technologieentwicklung mittels ML liegt darin, dass sie treibende Kräfte des modernen digitalen (Plattform-)Kapitalismus sind (Srnicek, 2022, S. 248–251). Srnicek beobachtet hier, dass die Erforschung dieser Technologien typischerweise einen starken Fokus auf die Datenbeschaffung und Aufbereitung gelegt hat und argumentiert, dass diese Phasen der Entwicklung von KI-Modellen zunehmend hintergründig im Wettbewerb der Big Tech-Firmen werden. Hingegen sieht er die Entwicklung, Implementierung bzw. Bereitstellung und Instandhaltung von ML-Modellen als zukünftigen Schauplatz der Konkurrenz an. Die bisherige Diskussion Alexas hat sich größtenteils mit der Erfassung der Daten beschäftigt, da das Generieren von Sprachinteraktionsdaten eine naheliegende Eigenschaft Alexas ist. Im nächsten Schritt soll hingegen ein Fokus auf die Entwicklung, Distribution und Wartung von ML-Modellen im Alexa-Ökosystem – auch in Verbindung zu Amazons weiteren Plattformen– gelegt werden. Ausgehend von der Verbesserung von Machine Learning Algorithmen und Technologien soll im Folgenden illustriert werden, wie Alexa zu diesen Verbesserungen von Algorithmen beiträgt.

4.2.3 Das Alexa-Ökosystem als Testinfrastruktur

Durch das Optimieren und Analysieren der verschiedenen Funktionen Alexas, kann Amazons Verständnis der Nutzung im Allgemeinen erhöht werden (Phan, 2019, S. 28; Srnicek, 2017, S. 95). Aus der Analyse der Nutzung und z.B. der Bereiche, die nicht mit Alexa in Verbindung gebracht werden, können einerseits fehlende Dienste identifiziert werden. Diese Lücken können dann im Sinne des Strebens nach Datenvielfalt und -menge durch neue Funktionen & Geräte als Erweiterung für Alexa geschlossen werden, welche wiederum einen gesteigerten Aktionsradius, bzw. ein wachsendes Anwendungsfeld für Nutzer:innen ermöglichen, da Alexa durch Skills und Geräte in mehr Anwendungssituationen integriert werden kann. Andererseits können bspw. durch Performanceanalysen, Fehlerprotokolle und Feedback Optimierungspotenziale für die bestehenden Dienste identifiziert werden (Munn, 2020, S. 274). Durch fortlaufende Tests von Skills und ML-Modellen können involvierte Technologien des Sprachassistenten verbessert werden. Diese Testkapazitäten gelten ebenfalls für die Erprobung von neuen Prototypen, Geräten, Skills und Modellen, die im laufenden Betrieb getestet werden können – was wieder auf das Finden von Optimierungspotenzialen zurückverweist. In der Hoffnung, durch ein schnelles Entwickeln einer breiten Funktionspalette den Markt für Sprachassistenten anzuführen, verlässt sich Amazon besonders auf das Veröffentlichen von Skills und Funktionen als minimum viable product (Stone, 2021, S. 47f.), was Nutzer:innen als Testinstanz für die Produktentwicklung und -optimierung einspannt. Hierunter fallen sowohl gänzlich neue Alexa Skills als auch Änderungen und Neuerungen in den involvierten Algorithmen von Textverständnis zu Empfehlungssystemen.8

Die Interaktion mit dem Sprachassistenten kann so als konstante Testsituation (siehe Gießmann & Gerlitz, 2023) gedeutet werden, in der sich Nutzer:innen wiederfinden, wodurch Alexa zur Testinfrastruktur für Amazon wird: Die Alltäglichkeit der Technologie führt zu einem Verschwimmen von Test- und Nutzungssituation (Marres & Stark, 2020, S. 434). Fourcade & Healy (2017, S. 13) formulieren, dass dies in Amazons Interesse ist: „The desire of firms to experiment on their own user base is driven mostly by their need to develop accurate, effective and socially acceptable services in a way that benefits the company“ (ebd.). Mittels implizit in der Nutzung gegebenem Feedback kann die Entwicklung der nächsten Produkt- und Dienstgeneration informiert werden. Dies ist zwar kein Novum (Mühlhoff, 2018), führt aber dazu, dass der Sprachassistent und die involvierten ML-Modelle stetig besser an unterschiedliche Anwendungsbereiche angepasst werden können. Perspektivisch soll so die routinierte Interaktion der Nutzer:innen in einer möglichst akkuraten und umfänglichen Form beobachtet, analysiert und geformt werden. Hierbei ist erneut hervorzuheben, dass die Menge an Algorithmen und Technologien, die benötigt wird, um Alexa hervorzubringen, sich in ständiger Weiterentwicklung und Justierung befinden und in dem Sinne basierend auf den Interaktionen, Anforderungen, Fehlern etc. ein kontinuierliches Testen und Anpassen an die Nutzung und Amazons Ziele geschieht; der Algorithmus befindet sich in einem dauernden trial-Zustand (Marres & Stark, 2020, S. 436ff.). Das anvisierte Ergebnis dieses Zustands ist die permanente Adaption anhand der Nutzung, wodurch letztlich selbstlernende Algorithmen in der Lage sein sollen robustere Modelle zu generieren, die Überraschungen und unerwarteten Situationen zuverlässiger reagieren können (Amoore, 2023, S. 27, 33). Hier zeigt sich die Kapazität Alexas, als Testinfrastruktur Amazons für das Entwickeln, Testen und Instandhalten verschiedener Algorithmen zu funktionieren – während Nutzer:innen Beeinträchtigungen oder Probleme in der Nutzung durch Änderungen erleben können (Bowker & Star, 2000, S. 34). Entsprechend Srniceks Hinweis auf die Bedeutung von Entwicklung und Instandhaltung moderner ML-Modellentwicklung (Srnicek, 2022, S. 251) lässt sich feststellen, dass Alexa nicht nur eine Datenquelle, sondern auch einen Beitrag zur Entwicklung von ML-Modellen bietet. Während Srnicek auf die Relevanz von hochqualifizierter Arbeit für die Entwicklung von KI-Modellen hinweist – die auch für Alexa nötig ist (Stone, 2021, S. 49) –, werden mittels Alexa Nutzer:innen als Tester:innen mobilisiert.9

Amazons Versuche Alexa in andere Geschäftsbereiche zu integrieren, lassen sich ebenso vor dem Hintergrund der Testinfrastruktur sehen. Ganz im Sinne des Solutionismus (Morozov, 2013) werden für die mit Alexa entwickelten technischen Lösungen geeignete Probleme in verschiedenen Branchen gesucht. So wird über das Alexa Smart Properties Core-Programm die Anbindung an verschiedene Institutionen des öffentlichen Lebens gesucht, die Amazon sonst verwehrt bleiben. Amazon wirbt damit, Alexa in Seniorenresidenzen und Krankenhäusern zur Kommunikation mit den zu Versorgenden, als Zimmerserviceinterface in der Hotellerie, als Meetings- und Terminplanungsassistent in Firmen und als fest verankertes Smarthome-System im Mietwohnungsbau zu integrieren (Amazon, 2023). Diese Vorstöße sollten nüchtern vor den bestehenden sozialen Institutionen der jeweiligen Länder betrachtet werden – ein stark reguliertes Gesundheitswesen bspw. könnte der Implementation engere Grenzen setzen. Betrachtet man parallel Amazons Versuch, sich im Gesundheitssektor zu etablieren (Kim, 2022), zeigt sich eben diese Querimplementierung Alexas als Instrument zum Sammeln von Daten und Testen von Algorithmen. Alexa soll als robuste Infrastruktur in verschiedenen Anwendungsbereichen fungieren und einen Teil dazu beitragen diese an eine Testinfrastruktur anzuschließen, um auch in diesen Bereichen die Plattformlogik des Testens für und durch Algorithmen zu etablieren. Jede Branche bringt neue Daten- und Interaktionstypen mit sich, welche die Entwicklung der allgemeinen (Sprach-)Modelle verbessern und wiederum die Robustheit fördern können. Die mutmaßliche Hoffnung ist es, so eine möglichst reibungslosere Nutzung für Nutzer:innen aller Art zu ermöglichen, welche im Namen der Reduktion von Reibung und Frustration eines von Amazons deklarierten Kernzielen ist, um Komplikationen im Vorfeld zu eliminieren und Nutzung zu steigern (West, 2022). Trotz dieser algorithmischen Kontrollversuche bleiben Friktionen und Probleme mit den Vorgaben in Privathaushalten (Goulden, 2019, 2021) und bei Firmen, die mit Amazon arbeiten, oder sich in einer Konkurrenzssituation befinden (European-Commission, 2022, S. 32–53; Nadler & Cicilline, 2020, S. 304–314) nicht aus. Letzteres bezieht sich auf die Herstellung reibungsloser Interaktion verschiedener Geräte, die von Machtungleichheiten geprägt ist. Als entsprechende Gegenbewegung wurde die Connectivity Standards Alliance zur gemeinsamen Bestimmung von Industriestandards für das Smarthome gegründet, wo Amazon jedoch auch eine „leading role in the development of these interoperability standards“ (Strüver, 2023, S. 115) einnimmt und bei Bedarf Einfluss auf Regulationen ausüben kann.

4.2.4 Alexa als Komfort-Infrastruktur des Smarthomes

Dank einer zunehmenden Qualität der Interaktion – im Sinne von weniger Abbrüchen und Reparaturen in den Kommandos, die an Alexa gegeben werden – in immer mehr Anwendungsbereichen mit Alexa, wird es Nutzer:innen einfacher gemacht, das Gerät stärker in den Alltag zu integrieren. IPA können zu einer Infrastruktur des Smarthome-Alltags werden, wenn z.B. verschiedene Geräte (wie Küchenuhr, Radio, Einkaufsliste) durch Alexa ersetzt und die Integration Alexas in Haushaltsgegenstände (wie Kühlschränke, Glühbirnen, Heizungen) als Infrastrukturalisierung betrachtet werden. Der Sprachassistent wird – in einem längeren iterativen Prozess (Pridmore & Mols, 2020, S. 6) – integraler Bestandteil für viele Haushaltshandlungen und immer wichtiger für alltägliche Abläufe. Dies wird besonders bei routinierten Handlungsabläufen ersichtlich, die im Rahmen von vorprogrammierten Ablaufroutinen stattfinden, wenn der IPA bspw. für den Start in den Tag Nachrichten vorliest, Lichter anschaltet, Musik abspielt und die Heizung im Badezimmer reguliert. Spätestens, wenn Nutzer:innen z.B. Möbel vor die durch Sprachsteuerung obsolet gewordenen Lichtschalter stellen und sie nicht mehr manuell nutzen können, zeigt sich die Verflechtung von Alltag und Sprachassistent. Der Sprachassistent als alltägliche Infrastruktur kann so in der lokalen Praxis je nach Nutzungsgrad unsichtbar werden. Für versierte Nutzer:innen kann er eine selbstverständliche Infrastruktur sein, während Neukund:innen häufig lernen müssen, wie mit dem Assistenten gesprochen wird (Reeves et al., 2019).

Der Logik des Testens und Verbesserns folgend, wird versucht dieses Phänomen durch eine steigende Interaktionsqualität zu minimieren, sodass die Technik seltener aktiv betrachtet werden muss. Versierte Nutzer:innen sind hingegen in der Lage, unterschiedliche Funktionen per Alexa zu bedienen, für die sie sonst verschiedene Geräte, Websites, Infrastrukturen und Plattformen hätten bedienen müssen. Betrachtet man wiederum die zentralen Gerätetypen der Produktpalette mit Alexaintegration, die Amazon anbietet, lassen sich klare Verbindungen von den Smarthome-Technologien zu anderen Bereichen Amazons herstellen. Initial ist die Verbindung zum Onlinehandel festzustellen, da Smarthome-Geräte auf Amazon.com verkauft werden, ob durch Drittanbieter, die alexakompatible Geräte herstellen (Strüver, 2023), oder von Amazon selber. Neben den zylindrischen Echo Speakern hat Amazon den Sprachassistenten auch in die Echo Show-Geräte mit Bildschirm und Kamera eingesetzt. Amazon bietet inzwischen auch einige Geräte mit Alexaschnittstelle an, die Kamerafunktionen haben. Hauptsächlich handelt es sich hier um drei Produktlinien: die tabletartigen Echo Show Geräte, die Homesecurity Geräte um Ring, und die Roomba Staubsaugerroboter. Mittels dieser Geräte erhalten Nutzer:innen Zugriff auf Funktionen, die auf der integrierten Kamera basieren. Echo Show fungiert als hausinterne Videochatoption, die Ring Türkameras bzw. -schlösser sind im Bereich der Heimsicherheit angesiedelt. Der Roomba (und experimentell auch die Always Home Cam-Drone und der Haushaltsroboter Astro) benötigt eine Kamera, um sich autonom im Haus fortzubewegen und staubzusaugen. Bei allen Gerätetypen spielt der AWS-Dienst zur Bilderkennung Rekognition – der z.B. auch in Amazons Warenhäusern genutzt wird (Beverungen, 2021, S. 186f.) – eine Rolle. In diesen Geräten finden also die Algorithmen zur Bild- und Sprachverarbeitung Amazons eine gemeinsame Anwendung und können sich durch erweiterte Anwendungsbereiche gegenseitig neue Trainingsdaten liefern, um die Algorithmen zu verbessern. Ähnlich die Fire TV Sticks, die USB-fähige Fernseher in einen Smart-TV verwandeln, welche in ihrer Fernbedienung einen Alexa-Knopf und ein Mikrofon haben. Alexa kann so als Sprachinterface in der Suche nach Filmen, Serien, Musik etc. genutzt werden (Amazon, 2022). Hier wird erneut die bereits etablierte Sprachtechnologie Alexas in Prime und Streaming integriert. Durch all diese infrastrukturellen Verbindungen, die Alexa im Smarthome für andere Geschäftsbereiche Amazons leistet, wird der Dienst verbessert und erweitert.

Auf Basis einer die Nutzer:innen zufriedenstellenden Nutzung kann Alexa als Infrastruktur des Alltags in diverse Lebensbereiche integriert werden, was wiederum zunehmend selbstverständliche Nutzung befördern kann. Shove (2003, S. 182f.) stellt diesen Zusammenhang für Haushaltstechnologien, die das Leben erleichtern sollen, fest und beschreibt eine selbsterhaltende Spirale, die durch convenience devices ausgelöst wird: „convenience devices […] increase reliance on (new) convenience devices to create periods of ‘quality’ time“ (Shove, 2003, S. 182). Auf Sprachassistenten trifft diese Annahme insofern zu, als viele Nutzer:innen nach einer Weile entweder eine ausgeprägte Nutzungspraxis haben und das Smarthome kontinuierlich erweitern (Pridmore & Mols, 2020, S. 6) oder aber die Nutzung komplett einstellen (Lopatovska et al., 2019). Vor dem Hintergrund des oben vorgestellten Kreislaufs lässt sich nachvollziehen, wieso Amazon in Anlehnung an Shoves selbstverstärkende Spirale eine ständige Optimierung und Ausweitung ihrer Dienste anstrebt, um Nutzer:innen durch ein großes funktionierendes Angebot zu motivieren, Alexa in mehr Bereiche ihres Alltags zu integrieren (Strüver, 2023, S. 117f.). Alexa agiert im erweiterten Smarthome, ähnlich wie Prime, welches dazu angelegt ist Kund:innen Anreize zu geben möglichst viel mit Amazonprodukten zu interagieren, als Serviceinfrastruktur für diese Dienste zu fungieren (Rowberry, 2022, S. 42) und gleichzeitig eine umfassendere Datenlage über die Kund:innen zu ermöglichen (West, 2022, S. 141f.).10 So fungieren beide für alle Beteiligten als infrastruktureller Zugang zu Amazons verschiedenen Plattformdiensten. Die Charakterisierung beider Dienste als bequeme One-Touch-Points für Kund:innen stimmt einerseits mit Amazons Selbstverständnis als service brand (West, 2022, S. 37) mit Fokus auf Kund:innenkomfort überein. Andererseits zeigen sich so gängige Plattformlogiken der Nutzungsmaximierung durch modulare, breite Anschlussfähigkeit und damit einhergehende Monopoltendenzen im Plattformökosystem. Im Sinne dieser plattformisierten Serviceorientierung kann Alexa schließlich als Convenience-Technologie im Sinne von Shove (2003) bzw. als verbindende Komfort-Infrastruktur für Amazons Endkunden zugewandten Geräte und Dienste im Smarthome und darüber hinaus bezeichnet werden. Als solche bietet Alexa Querintegrationen von verschiedenen Kerntechnologien Amazons in verschiedene Anwendungs- und Praxisbereiche (Streaming, Heimtechnologien, Empfehlungssysteme) und trägt zum firmeninternen Informations- und Datengewinn bei, welcher nun abschließend thematisiert wird.

4.2.5 Qualität von Trainingsprozessen

Amazon wird oftmals auf den Onlinehandel reduziert (Rowberry, 2022, S. 27ff.). Entsprechend ist Alexas Anbindung an den Marketplace, auch wenn Nutzer:innen den Assistenten kaum zum Einkaufen nutzen (Ammari et al., 2019, S. 23), nicht zu ignorieren. Grundlegende Marketplace-Technologien (siehe Buy-Box), die das Einkaufen möglichst einfach für Kund:innen gestalten sollen, bilden ebenso die Basis für Einkäufe via Alexa (Phan, 2019, S. 30; Stone, 2021, S. 47f.). Am Shopping über Alexa lassen sich Interaktionsdatenflüsse nachweisen, die zu Werbezwecken an andere Plattformen gehen (Iqbal et al., 2022). Dieser Rolle entsprechend, etabliert Amazon Alexa als Komfort-Infrastruktur mit steigendem Aktionsradius, die möglichst viele Amazon-Dienste vereint und somit ein volleres Datenbild der Nutzer:innen abbilden kann. Jede Interaktion mit Alexa (und den so kontrollierten Geräten und Diensten) kann als Information genutzt werden, um Interessen und Präferenzen abzuleiten; es verdichtet sich zunehmend ein Bild über Nutzer:innen und aggregierte Nutzungstypen. So erhalten Firmen wie Amazon immer tiefere Einblicke in häusliche Umgebungen und erkennen, wie Nutzer:innen Geräte und Dienste im Alltag nutzen (Sadowski et al., 2021, S. 4). Auf diese Weise können durch Alexa routinisiert Daten aus den Haushalten generiert werden, ohne dass dies ersichtlich wird. Dieses Argument leitet über zu den letzten beiden Aspekten des Kreislaufmodells, da einerseits so die Menge der Daten und andererseits die Qualität und Genauigkeit der Daten, durch ein akkurateres Bild über den Alltag der Kund:innen mit möglichst wenig blinden Flecken in der Datenerfassung, steigen soll. Zum einen wird ein weiterer Interessenbereich der Nutzer:innen abgedeckt, anstatt eines kleinen, von der begrenzten Produkt- und Dienstleistungspalette vorgegebener Teil. Zum anderen erleichtern verbesserte Algorithmen wie z.B. eine bessere Sprachverarbeitung die Nutzung, da Suchanfragen weniger Einschränkungen unterliegen können (Reeves et al., 2019, S. 363), was die kommunikative Barriere (Cohn & Zellou, 2021), die Nutzer:innen gegenüber Alexa haben, abbauen kann. Hierdurch kann Amazon mehr und genauere bzw. authentischere und weniger artifizielle Informationen über Kund:innen erlangen, auf anderen Plattformen gezielte Werbung schalten und Algorithmen verbessern, die in verschiedenen Produkten Anwendung finden. Mit diesen Informationen und Algorithmen ausgestattet experimentiert Amazon letztlich mit neuen Formen der Datenaufbereitung, die sich nicht zwingend an etablierten Praktiken der entsprechenden Branchen orientieren, um Aufmerksamkeit für Dienste und Produkte zu gewinnen– wie Rowberry (2022, S. 44) für unübliche Kategorien im Buchhandel herausarbeitet. Letztlich ist dieser Informationsgewinn in den Kontext des ganzen Kreislaufs zu setzen, der sich an dieser Stelle, an die Verbesserung von ML-Prozessen und Geräten anknüpfend, wieder schließt und wiederholt.

Mit dem Marketplace, AWS, Prime und Alexa hat Amazon verschiedene Dienste und Technologien, die allesamt vom Trainieren von ML-Algorithmen und dem Aufbau einer Informationsinfrastruktur profitieren. Viele der vorgestellten Technologien finden (indirekte) Verwendung im modernen Smarthome, so wie Amazon es vorschlägt. Eine Durchdringung des Alltags durch diese Plattformen und Infrastrukturen kann letztlich die Weiterentwicklung verschiedener Technologien durch ein immer dichter werdendes Netz an Informationsverarbeitung bedeuten: “Increasingly, however, what stands in for the individual […] is not an aggregate, or a position in a statistical distribution, but a precise set of digital records, drawn from a wide range of sources” (Fourcade & Healy, 2017, S. 11), sodass letztlich detaillierte und akkurate Datenbasen als Grundlage neuer Testinstrumente für eine wachsende Demographie der Smarthome-Nutzer:innen entstehen: Alexa als Plattformtechnologie wird so zur erlernten, im Hintergrund verschwindenden Komfort-Infrastruktur des Alltags für Nutzer:innen, zur aktiv betrachteten, manipulierbaren Test- und Entwicklungsinfrastruktur für Amazons breite Produktpalette, und zur Dienstleistungsinfrastruktur für Geschäftskunden. Diese infrastrukturelle Entwicklung soll nun zusammenfassend in den weiteren Kontext der Plattformtechnologien und deren sozialwissenschaftlichen Erforschung gesetzt werden.

5 Plattformökosysteme im Wandel als theoretisches Element

Während Plattformfirmen klassischerweise einen Großteil ihres Umsatzes über den Verkauf von Werbeflächen und -informationen sowie Produkten generieren (Dolata, 2019, S. 186), scheinen Sprachassistenten mit diesem Schema zu brechen. Dass Amazon im November 2022 im Zuge von branchenweiten Personalkürzungen besonders auch das Alexa-Team verkleinerte, scheint diesem Einwand Recht zu geben. Während Berichte vermuten, dass Amazon das Vertrauen in Alexa verloren hätte, versichert Amazon, dass die Firma weiterhin im Namen der Kund:innen in Alexa investieren wird (Kim, 2022). Die hier dargelegten Argumente zeigen ebenfalls eine Vielzahl an Implementationen des Sprachassistenten, die anderweitige Rechtfertigungen für die Technologie Alexa geben. Die Nachrichten der Budgetkürzungen geben jedoch Anlass dazu, die Rolle von Sprachassistenten als Plattform und Infrastruktur auf einer abstrakteren Ebene zu reflektieren und ungeachtet Amazons zukünftiger Pläne ein theoretisches Argument für die Erforschung von Einzeltechnologien in Plattformökosystemen weiterzuentwickeln. Dazu ist es hilfreich, Alexa als Plattformtechnologie, die auf anderen Plattformen und Infrastrukturen aufbaut, zu betrachten (Edwards, 2021, S. 361ff.). Vor diesem Hintergrund stellt Edwards fest, dass sich Plattformen als Infrastruktur dank der zu Grunde liegenden Technologien rasant ausbreiten und ggf. ebenso schnell wieder irrelevant werden können. In anderen Worten bedarf eine soziotechnische Analyse moderner Plattformtechnologien ebenfalls einer Betrachtung derer Plattformökosysteme und den jeweiligen Entwicklungsstadien.

Rekapituliert man zunächst die Ausbreitung Alexas als isolierte Technologie, lassen sich ohne eine Genealogie Alexas (siehe Stone, 2021, S. 22–53) zu zeichnen, Ähnlichkeiten zum Werdegang des Marketplaces finden. So zeigt Weigel (2023, S. 11) den soziotechnischen Wandel des Marketplace und zeichnet nach, wie sich die Plattform aus einer volatilen Expansionszeit heraus zu einer institutionalisierten und regulierten globalen Infrastruktur entwickelt hat. Die rasante Entwicklung und weltweite Expansion der Echo-Geräte in Haushalten (West, 2022, S. 108f.) sowie der spätere Versuch der Standardisierung von Gerätenutzung und Dienstentwicklung (Strüver, 2023) ähneln Weigels Beschreibung der allmählichen Entwicklung der Plattform zu einer globalen Infrastruktur. Anders gesagt zeigt sich die Infrastrukturalisierung einer Plattform, da nicht mehr die Expansion und Entwicklung, sondern die Verwertung und Verwaltung der etablierten Technologien und deren Querverbindungen eine zentrale Rolle einnehmen (Plantin et al., 2018). In diesem Sinne lässt sich die Phase der Entwicklung der notwendigen Technologie und das Verbreiten der Echo-Geräte bei Kund:innen und anderen Firmenkunden als eine Art Infrastrukturaufbau betrachten, in dem Amazon Alexa etabliert hat. Amazon ist für die Bereitschaft bekannt, Kosten aufzunehmen, um eine Infrastruktur zu etablieren (Rowberry, 2022, S. 42). Die Entwicklung Alexas fällt in eben dieses Schema eines kostspieligen Infrastrukturaufbaus. Dies wird von Amazons Credo unterstützt, (alte) Geräte so lange wie möglich nutzbar zu halten (ebd., S. 64), da die Hardware für web- und cloudbasierte Plattformen zwar kaum relevant ist (Edwards, 2021, S. 318), jedoch trotzdem existieren muss. Die entwickelten Algorithmen und Technologien zur Sprachinteraktion und die Echo-Geräte in den Haushalten bilden nun eine infrastrukturalisierte Plattform, deren Wegfall den Alltag vieler Menschen beeinflussen würde. Auch wenn das Smarthome, wie eingangs erwähnt, derzeit noch als Zukunftsvision gilt (Sadowski, 2020, S. 114f.), werden in der aufgezeigten Entwicklung bereits die Bausteine für diese Zukunft gelegt: Ausgehend von einem Narrativ der zukünftigen Etablierung und Normalisierung von Smart Speakern und Smarthomes in den Haushalten der Zukunft, welches von Amazon propagiert wird (Jassy, 2022), lässt sich diese infrastrukturalisierte Plattform als in die Zukunft gerichtet betrachten. Mit Alexa als Sprachsteuerungs- und Komfortinfrastruktur hat Amazon eine Plattform für eben diese Zukunft aufgebaut, die sich in kontinuierlicher Verbesserung und Erweiterung selbst hervorbringt – ein typisches Merkmal von Narrativen solcher Großkonzerne, die durch ihre Produktversprechen die propagierten Zukünfte wahrscheinlicher machen (Jasanoff, 2015). In diesem Sinne fungiert Infrastruktur als Zukunftsreferenzpunkt: “it promises a certain kind of utopian future, in the form of a world subtended by and supported through new infrastructure” (Slota & Bowker, 2017, S. 547). Das in diesem Beitrag vorgestellte iterative Kreislaufmodell eignet sich, um eben solche Trajektorien von Sprachassistenten zu analysieren und einzelne Momente im Innovationsprozess kritisch zu hinterfragen.

Kontextualisiert man diese Prozesse nun mit dem restlichen Plattformökosystem Amazons, lässt sich herausarbeiten, dass eine Einzelplattform relativ zu ihrem Entwicklungsstadium und zu den anderen Plattformen anders gesehen werden kann. Akzeptiert man die Prognose von Srnicek (2022, S. 253), dass das Beschaffen von Daten als Ziel von Plattformen zu Gunsten der Erstellung, Implementierung und Instandhaltung von ML-Technologien an Bedeutung verliert, zeichnet sich die Relation von Plattform und ihrem Ökosystem in der Änderung der Prioritäten ab. Wie in diesem Beitrag gezeigt wurde, bietet Alexa als Dateninfrastruktur Möglichkeiten für Amazon, große Datensätze für Sprachinteraktionen anzulegen und Informationen über Nutzer:innen zu gewinnen. Hierbei ist zu erwähnen, dass durch Alexa spezialisierte, proprietäre Datensätze und Modelle entstehen, die weiterhin Amazons Marktposition sowohl in der Werbebranche (auch wenn keine offiziellen Werbeeinnahmen existieren) als auch im ML-Bereich sichern (Bessen, 2022, S. 94). So bespielt der Assistent beide Rollen der Datenbeschaffung und der Entwicklung von großen ML-Modellen. Die Verbindung zum Amazon-Ökosystem ist dabei von Grund auf angelegt, wie anhand der verschiedenen Querintegrationen in andere Dienste gezeigt wurde. AWS, Prime und der Marketplace sind nicht nur Grundbedingungen Alexas, ohne die der Sprachassistent nicht in der Form existieren würde, sondern auch involviert in die Entwicklung verschiedener Algorithmen für Sprach - und Textmodelle, Empfehlungs- oder auch Bilderkennungssysteme. Mittels eines Sprachassistenten mit ausgereiften Funktionalitäten in einem weiten Anwendungsradius kann eine Vielzahl an Nutzer:innen (sei es im Smarthome oder im Firmenumfeld) akquiriert werden, um anhand ihrer Interaktionen verschiedene Algorithmen zu testen und justieren.

Diese Vermutungen sehen augenscheinlich Bestätigungen in der Entwicklung von AWS Bedrock (Amazon.com, 2023) – Amazons Angebot an ML-Modellen für Firmenkunden, welches anderen Large Language Models (LLM) wie ChatGPT Konkurrenz machen soll. Auch wenn die Entwicklungsdaten für solche Modelle nicht nur aus der Interaktion mit Alexa gespeist sein können, bietet Alexa einen Datenkorpus und vor allem eine Infrastruktur zur Erprobung und Distribution von Sprachmodellen, die in der Entwicklung von Bedrock Anwendung gefunden haben werden, welche letztlich wieder zurück in die Weiterentwicklung Alexas fließen können: „And we’ve had a large language model underneath it [Alexa], but we’re building one that’s much larger and much more generalized and capable“ (ebd.). Betrachtet man Alexa insofern als Teil von Amazons Plattformökosystem, wurde die Rolle des Assistenten von einer Datensammlungsinfrastruktur zu einer Testinfrastruktur erweitert. Im Gegensatz zu einer Betrachtung, die nur Alexa als Einzeltechnologie in den Blick nimmt, gibt dieser relationale Ansatz, der die Technologie im Umfeld der anderen Plattformen sieht, die Möglichkeit, Funktionsweisen und Narrative und entsprechend auch deren Implikationen für Gesellschaft und Organisationen, anders einzuschätzen. Eine Nachricht wie die Budgetkürzungen können in einer singulären Technologiebetrachtung schockierend wirken – einige Medienhäuser haben über die Angst um einen Wegfall Alexas für Nutzer:innen berichtet (Kim, 2022) – und Zukunftsaussichten einer Technologie in Frage stellen. Betrachtet man hingegen den Entwicklungszyklus und die Abzweigungen in das Plattformökosystem, lässt sich diese Nachricht anders bewerten. Die Rolle sowie Funktion der Plattformen befinden sich gemeinsam in relationaler gegenseitiger Anpassung und ihre Wichtigkeit verändert sich über den Werdegang der Technologie hin. Vor diesem Hintergrund lässt sich Edwards Vermutung über die Wandelbarkeit der infrastrukturalisierten Plattformbranche neu kontextualisieren: „the astoundingly rich tech giants clearly understand the fragile, highly ephemeral character of nearly everything they currently offer. […] Software platforms rise and fall, in other words, but the corporate leviathans behind them will remain“ (Edwards, 2021, S. 333).

Einzelne Plattformtechnologien so als kontingent im Rahmen des Erfolgs der Mutterfirma zu verstehen, verschiebt den Fokus der Betrachtung auf die Relation zwischen den verschiedenen Diensten einer Firma. Der externe Einfluss von anderen Plattformtechnologien – wie LLMs in Form von ChatGPT – verdeutlicht auch dies, da Amazon vor der Herausforderung steht, einen Umgang mit dieser neuen Technologie für ihren Dienst Alexa zu finden, der im Sinne der Möglichkeiten der restlichen Plattformökologie ist: Auch wenn Amazon sich entscheidet Alexa mit einem generativem KI-Modell auszustatten gibt es technische, geschäftliche und nutzungsbedingte Hindernisse, die eine schnelle Umstellung erschweren: „For example, Alexa is optimized for quick interactions and has rules about how long it will wait for instructions and is designed to provide relatively short responses. Generative AI [LLMs] responses can take much longer to generate and then speaking them to the user would add more time“ (Kinsella, 2023). Der (sonst in diesem Artikel ausgelassene) Vergleich zu Googles Sprachassistent zeigt hier, dass das bestehende Plattformökosystem entscheidend für die Adaptionsmöglichkeiten einzelner Technologien sein kann, da Google – dessen Technologien größtenteils Textbasiert sind – offensichtlichere Trainings- und Implementierungsmöglichkeiten für ein LLM in Googles Sprachassistenten vorfindet (ebd.). Solche Widerständigkeiten gegen Veränderung sind auch für elektronische Infrastrukturen insofern nicht ungewöhnlich, als das Internet auf harten und klassischen Infrastrukturen wie Unterseekabeln basiert (Starosielski, 2015) und auch in scheinbar fluiden elektronischen Informationsinfrastrukturen sehr rigide Barrieren existieren können (Star, 1999, S. 389). Im gegebenen Beispiel Alexas ist das übrige Plattformökosystem insofern ein solches entscheidendes Element, als dass eine bestehende Produktpalette den Rahmen für Veränderungen beeinflusst. Die von Edwards (2021) propagierte Schnelllebigkeit und Fragilität von Plattformtechnologien, die auf anderen Infrastrukturen aufbauen, erfährt hier entsprechend eine Einschränkung bzw. den Hinweis, dass die Beschaffenheiten dieser zugrundeliegenden Infrastrukturen maßgeblich für den Adaptionsspielraum sind, welcher durch Veränderungen auch vor dem schnellen Zusammenbruch bewahren können. Bei KI-basierten Plattformtechnologien wie Sprachassistenten scheint es naheliegend, dass der Spielraum letztlich davon abhängt, welche Datenformen und -mengen, sowie Entwicklungsumgebungen als Trainingsgrundlage für die Weiterentwicklung neuer Algorithmen bzw. Technologien zur Verfügung stehen. Das Argument des durch infrastrukturelle Beziehungen verbundenen Plattformökosystems ist somit besonders wirkungsvoll, da die Plattformen durch solche Weiterentwicklungen zusätzliche infrastrukturelle Beziehungen (Slota & Bowker, 2017, S. 531) untereinander bilden, die es ihnen ermöglichen Daten und Entwicklungsumgebungen auszutauschen und Adaptionsräume zu etablieren.

Wie eingangs erwähnt sind infrastukturalisierte Plattformen mit Normen, Werten und Zielen aufgeladen (Star, 1999, S. 389). Diese konnten hier in Teilen für den Sprachassistenten Alexa illustriert werden. Den Herstellern solcher Plattformtechnologien, die von einer Vielzahl von Menschen und Institutionen täglich genutzt werden, kommt entsprechend viel Ausrichtungsmacht zu, die sich letztlich in den infrastrukturellen Beziehungen begründet, in die die Technologien eingebunden werden. Die hier vorgestellte Untersuchung zeigt verschiedene Stadien dieser Beziehungen und die entsprechenden Machtmomente auf, in denen der Sprachassistent Alexa als Infrastruktur fungiert. Stellt man gegenüber, dass viele Nutzer:innen Alexa für tägliche Haushaltsroutinen nutzen und Amazon gleichzeitig gerade in dieser Nutzung Alexa als Entwicklungsinfrastruktur entfaltet, werden solche Machtpositionen besonders sichtbar. Daran zeigt sich jedoch ebenfalls die Wandelbarkeit von Alexa, als sich Ziele und Wünsche von Nutzer:innen als auch von Amazon ändern können. Diese Temporalität, die sich im dargestellten Innovationskreislauf wiederspiegelt, macht es erforderlich, infrastrukturalisierte Plattformen vor dem Hintergrund ihrer Plattformökosysteme zu betrachten. Auf diese Weise kann Srniceks Prognose über den Wandel der Prioritäten von Plattformen gemeinsam mit seinem Hinweis auf die Formen von Arbeit und materiellen Gegebenheiten (Srnicek, 2022, S. 248ff.), die für KI relevant werden, als kritischer Impetus für zukünftige Forschung genutzt werden. Die Verbreitung von Sprachassistenten wie Alexa als Convenience-Technologie in Haushalten konnte in diesem Beitrag illustriert werden. Vor der Annahme, dass sich die Verbreitung des Smarthomes verstärkt, könnte sich eine Untersuchung von Testsituationen und Datenpraktiken der Nutzer:innen in einem längeren Zeitrahmen lohnen, weil durch die Infrastrukturalisierung von Plattformen im Haushalt undurchsichtige Datenpraktiken direkten Einzug in den Alltag der Nutzer:innen halten und Nutzer:innen sich ihrer Rolle im Wandel von Plattformtechnologien ggf. bewusst sind und von ihnen rationalisiert werden (siehe z.B. Waldecker et al., 2023). Schließlich ist Amazons Kooperation mit Drittanbietern im Smart Speaker-Bereich soziologisch weitestgehend unerforscht. Nach der Etablierung Alexas als Infrastruktur und Plattform ist Amazon darauf bedacht, Standardisierungsarbeit zu leisten und soziale Institutionen zu schaffen bzw. zu beeinflussen und so verschiedene Akteure in das Narrativ um Alexa zu involvieren. Die Perspektiven von Akteuren, die mit Amazon zusammenarbeiten, sind für das Smarthome aus einer Kartellrechtperspektive (European-Commission, 2022) und für Drittanbieter auf dem Marketplace (Weigel, 2023) gut dokumentiert. Eine ähnliche Studie, die auf Drittanbieterökosysteme um Smart Speaker bzw. das Smarthome fokussiert, könnte jedoch tiefere Einblicke in das hier entworfene Kreislaufmodell bieten und das Feld um eine wertvolle Perspektive erweitern. Besonders der Aspekt solcher Arbeitsverhältnisse im Plattformökosystem bietet die Möglichkeit, Hierarchien herauszuarbeiten und Technologiekomplexe wie Alexa kritisch zu hinterfragen.

6 Danksagung

Ich möchte mich bei Tim Hector, Sascha Zantis, Marcus Burkhard, Dagmar Hoffmann und den Gutachter:innen für tiefgehende und wertvolle Hinweise bedanken.

Autor*innenbeiträge

Niklas Strüver hat die Daten erhoben und den Beitrag verfasst.

Datenverfügbarkeit

Alle relevanten Daten befinden sich innerhalb der Veröffentlichung.

Finanzierung

Gefördert wird diese Arbeit durch die Deutsche Forschungsgemeinschaft (DFG) – Projektnummer 262513311 – SFB1187.

Interessenskonfliktstatement

Es liegen keine Interessenkonflikte vor.

Referenzen

Amazon. (2022). Q3 Earnings. Zugriff am 2.3.2023. Verfügbar unter: https://s2.q4cdn.com/299287126/files/doc_financials/2022/q3/Q3-2022-Amazon-Earnings-Release.pdf

Amazon. (2023). Alexa Smart Properties. Amazon (Alexa). Zugriff am 3.4.2023. Verfügbar unter: https://web.archive.org/web/20230316112724/https://developer.amazon.com/en-US/alexa/alexa-smart-properties

Amazon.com. (2023). Amazon.com, Inc (AMZN) Q1 2023 Earnings Call Transcript. Zugriff am 2.5.2023. Verfügbar unter: https://web.archive.org/web/20230504000054/https://seekingalpha.com/article/4597544-amazon-com-inc-amzn-q1-2023-earnings-call-transcript

Ammari, T., Kaye, J., Tsai, J. Y. & Bentley, F. (2019). Music, Search, and IoT: How People (Really) Use Voice Assistants. ACM Transactions on Computer-Human Interaction, 26(3), 1–28. https://doi.org/10.1145/3311956

Amoore, L. (2023). Machine learning political orders. Review of International Studies, 49(1), 20–36. https://doi.org/10.1017/S0260210522000031

Baldwin, C. Y. & Woodard, C. J. (2008). The Architecture of Platforms: A Unified View. Nr. 09-034. Harvard Business School. Verfügbar unter: http://hbswk.hbs.edu/item/6025.html

Bessen, J. (2022). The new goliaths: how corporations use software to dominate industries, kill innovation, and undermine regulation. New Haven: Yale University Press.

Beverungen, A. (2021). The Invisualities of Capture in Amazon’s Logistical Operations. Digital Culture & Society, 7(2), 185–202. https://doi.org/10.14361/dcs-2021-070209

Bezos, J. (2016). 2015 Letter to Shareholders. Verfügbar unter: https://s2.q4cdn.com/299287126/files/doc_financials/annual/2015-Annual-Report.pdf

Bezos, J. (2017). 2016 Letter to Shareholders. US About Amazon. Zugriff am 5.3.2023. Verfügbar unter: https://www.aboutamazon.com/news/company-news/2016-letter-to-shareholders

Bowker, G. C. & Star, S. L. (2000). Sorting things out: classification and its consequences (Inside technology). Cambridge, Mass: MIT Press.

boyd, danah & Crawford, K. (2012). CRITICAL QUESTIONS FOR BIG DATA: Provocations for a cultural, technological, and scholarly phenomenon. Information, Communication & Society, 15(5), 662–679. https://doi.org/10.1080/1369118X.2012.678878

Brause, S. R. & Blank, G. (2020). Externalized domestication: smart speaker assistants, networks and domestication theory. Information, Communication & Society, 32(4), 751–763. https://doi.org/10.1080/1369118X.2020.1713845

Brause, S. R. & Blank, G. (2023). „There are some things that I would never ask Alexa“ – privacy work, contextual integrity, and smart speaker assistants. Information, Communication & Society, 1–16. https://doi.org/10.1080/1369118X.2023.2193241

Burrell, J. (2016). How the machine „thinks“: Understanding opacity in machine learning algorithms. Big Data & Society, 3(1), 1–12. https://doi.org/10.1177/2053951715622512

Burrell, J. & Fourcade, M. (2021). The Society of Algorithms. Annual Review of Sociology, 47(1), 213–237. https://doi.org/10.1146/annurev-soc-090820-020800

Cantador, I., Fernández-Tobías, I., Berkovsky, S. & Cremonesi, P. (2015). Cross-Domain Recommender Systems. In F. Ricci, L. Rokach & B. Shapira (Hrsg.), Recommender Systems Handbook (S. 919–959). Boston, MA: Springer US. https://doi.org/10.1007/978-1-4899-7637-6_27

Cohn, M. & Zellou, G. (2021). Prosodic Differences in Human- and Alexa-Directed Speech, but Similar Local Intelligibility Adjustments. Frontiers in Communication, 6. https://doi.org/10.3389/fcomm.2021.675704

Crawford, K. & Joler, V. (2018). Anatomy of an AI System. Zugriff am 13.12.2019. Verfügbar unter: http://www.anatomyof.ai

Dahlgren, K., Pink, S., Strengers, Y., Nicholls, L. & Sadowski, J. (2021). Personalization and the Smart Home: questioning techno-hedonist imaginaries. Convergence: The International Journal of Research into New Media Technologies, 27(5), 1–15. https://doi.org/10.1177/13548565211036801

Delfanti, A. & Frey, B. (2021). Humanly Extended Automation or the Future of Work Seen through Amazon Patents. Science, Technology, & Human Values, 46(3), 655–682. https://doi.org/10.1177/0162243920943665

Deutscher-Bundestag. (2019). Zulässigkeit der Transkribierung und Auswertung von Mitschnitten der Sprachsoftware "Alexa“ durch Amazon. Nr. WD 10 - 3000 - 032/19. Berlin: Wissenschaftliche Dienste des Deutschen Bundestags. Zugriff am 1.6.2019. Verfügbar unter: https://www.bundestag.de/resource/blob/650728/3f72e6abc1c524961e5809002fe20f21/WD-10-032-19-pdf-data.pdf

Dijck, J. V. (2020). Seeing the forest for the trees: Visualizing platformization and its governance: New Media & Society, 23(9), 2801–2819. https://doi.org/10.1177/1461444820940293

Dijck, J. van. (2013). The culture of connectivity: a critical history of social media. Oxford; New York: Oxford University Press.

Dolata, U. (2019). Privatization, curation, commodification: Commercial platforms on the Internet. Österreichische Zeitschrift für Soziologie, 44(S1), 181–197. https://doi.org/10.1007/s11614-019-00353-4

Edwards, P. N. (2021). Platforms Are Infrastructures on Fire. In T.S. Mullaney, B. Peters, M. Hicks & K. Philip (Hrsg.), Your Computer Is on Fire (S. 313–336). Cambridge, Massachusetts ; London England: The MIT Press. https://doi.org/10.7551/mitpress/10993.003.0021

Egliston, B. & Carter, M. (2022). „The metaverse and how we’ll build it“: The political economy of Meta’s Reality Labs. New Media & Society, 146144482211197. https://doi.org/10.1177/14614448221119785

Ensmenger, N. (2021). The Cloud is a Factory. In T.S. Mullaney, B. Peters, M. Hicks & K. Philip (Hrsg.), Your computer is on fire (S. 29–49). Cambridge, Massachusetts ; London England: The MIT Press.

European-Commission. (2022). COMMISSION STAFF WORKING DOCUMENT Accompanying the document: Final report on consumer Internet of Things sector inquiry. Brüssel: European Commission. Zugriff am 28.5.2022. Verfügbar unter: https://ec.europa.eu/commission/presscorner/detail/en/ip_22_402

Fischer, J. E., Reeves, S., Porcheron, M. & Sikveland, R. O. (2019). Progressivity for voice interface design. In Proceedings of the 1st International Conference on Conversational User Interfaces - CUI ’19 (S. 1–8). Dublin, Ireland: ACM Press. https://doi.org/10.1145/3342775.3342788

Fourcade, M. & Healy, K. (2017). Seeing like a market. Socio-Economic Review, 15(1), 9–29. https://doi.org/10.1093/ser/mww033

Gießmann, S. & Gerlitz, C. (2023). Test. Einleitung in den Schwerpunkt. Zeitschrift für Medienwissenschaft, 15(29), 10–19. https://doi.org/10.25969/MEDIAREP/20051

Gillespie, T. (2018). Custodians of the internet: platforms, content moderation, and the hidden decisions that shape social media. New Haven: Yale University Press.

Goulden, M. (2019). Delete the family: platform families and the colonisation of the smart home. Information, Communication & Society, 24(7), 903–920. https://doi.org/10.1080/1369118X.2019.1668454

Goulden, M. (2021). Folding and Friction: The Internet of Things and Everyday Life. In D.A. Rohlinger & S. Sobieraj (Hrsg.), The Oxford Handbook of Sociology and Digital Media (S. 219–240). Oxford University Press. https://doi.org/10.1093/oxfordhb/9780197510636.013.20

Hargreaves, T., Wilson, C. & Hauxwell-Baldwin, R. (2018). Learning to live in a smart home. Building Research & Information, 46(1), 127–139. https://doi.org/10.1080/09613218.2017.1286882

Harris, M. (2023). Palo Alto: a history of California, capitalism, and the world. New York: Little, Brown; Company.

Häußling, R. (2017). Relationale Technik- und Organisationssoziologie. Soziologie : Forum der Deutschen Gesellschaft für Soziologie, 46(1), 47–50.

Hector, T. (2023). Smart Speaker in der Praxis. Methodologische Überlegungen zur medienlinguistischen Erforschung stationärer Sprachassistenzsysteme. Sprache und Literatur, 51(2), 197–229. https://doi.org/10.30965/25890859-05002021

Hine, C. (2019). Strategies for Reflexive Ethnography in the Smart Home: Autoethnography of Silence and Emotion. Sociology, 54(1), 22–36. https://doi.org/10.1177/0038038519855325

Humphry, J. & Chesher, C. (2021). Visibility and security in the smart home. Convergence: The International Journal of Research into New Media Technologies, 27(5), 1170–1188. https://doi.org/10.1177/13548565211030073

Iqbal, U., Bahrami, P. N., Trimananda, R., Cui, H., Gamero-Garrido, A., Dubois, D. et al. (2022). Your Echos are Heard: Tracking, Profiling, and Ad Targeting in the Amazon Smart Speaker Ecosystem. arXiv:2204.10920 [cs].

Jasanoff, S. (2015). Future Imperfect Science, Technology, and the Imaginations of Modernity. In S. Jasanoff & S.-H. Kim (Hrsg.), Dreamscapes of Modernity: Sociotechnical Imaginaries and the Fabrication of Power (S. 1–33). University of Chicago Press. https://doi.org/10.7208/chicago/9780226276663.001.0001

Jassy, A. (2022). 2021 Letter to Shareholders. US About Amazon. Zugriff am 4.3.2023. Verfügbar unter: https://www.aboutamazon.com/news/company-news/2021-letter-to-shareholders

Jaton, F. (2021). Assessing biases, relaxing moralism: On ground-truthing practices in machine learning design and application. Big Data & Society, 8(1). https://doi.org/10.1177/20539517211013569

Karppi, T. & Granata, Y. (2019). Non-artificial non-intelligence: Amazon’s Alexa and the frictions of AI. AI & SOCIETY, 34(4), 867–876. https://doi.org/10.1007/s00146-019-00896-w

Khan, L., M. (2018). Amazon—An Infrastructure Service and Its Challenge to Current Antitrust Law. In M. Moore & D. Tambini (Hrsg.), Digital dominance: the power of Google, Amazon, Facebook, and Apple (S. 98–129). New York, NY: Oxford University Press.

Kim, E. (2022). Amazon is gutting its voice assistant, Alexa. Employees describe a division in crisis and huge losses on ’a wasted opportunity.’. Business Insider. Zugriff am 24.11.2022. Verfügbar unter: https://web.archive.org/web/20230106123404/https://www.businessinsider.com/amazon-alexa-job-layoffs-rise-and-fall-2022-11

Kinsella, B. (2023). Google Assistant and Alexa Are Both Getting Generative AI Makeovers. Synthedia. Substack newsletter,. Zugriff am 2.8.2023. Verfügbar unter: https://web.archive.org/web/20230803220610/https://synthedia.substack.com/p/google-assistant-and-alexa-are-both

Kitchin, R. (2017). Thinking critically about and researching algorithms. Information, Communication & Society, 20(1), 14–29. https://doi.org/10.1080/1369118X.2016.1154087

Lau, J., Zimmerman, B. & Schaub, F. (2018). Alexa, Are You Listening?: Privacy Perceptions, Concerns and Privacy-seeking Behaviors with Smart Speakers. Proceedings of the ACM on Human-Computer Interaction, 2(CSCW), 1–31. https://doi.org/10.1145/3274371

Lopatovska, I., Rink, K., Knight, I., Raines, K., Cosenza, K., Williams, H. et al. (2019). Talk to me: Exploring user interactions with the Amazon Alexa. Journal of Librarianship and Information Science, 51(4), 984–997. https://doi.org/10.1177/0961000618759414

Maalsen, S. & Sadowski, J. (2019). The Smart Home on FIRE: Amplifying and Accelerating Domestic Surveillance. Surveillance & Society, 17(1/2), 118–124. https://doi.org/10.24908/ss.v17i1/2.12925

Mackenzie, A. (2017). Machine Learners: Archaeology of a Data Practice. Cambridge, Massachusetts London, England: The MIT Press. https://doi.org/10.7551/mitpress/10302.001.0001

Marres, N. & Stark, D. (2020). Put to the test: For a new sociology of testing. The British Journal of Sociology, 71(3), 423–443. https://doi.org/10.1111/1468-4446.12746

Mols, A., Wang, Y. & Pridmore, J. (2021). Household intelligent personal assistants in the Netherlands: Exploring privacy concerns around surveillance, security, and platforms. Convergence: The International Journal of Research into New Media Technologies, 28(6), 1841–1860. https://doi.org/10.1177/13548565211042234

Morozov, E. (2013). To save everything, click here: the folly of technological solutionism (First edition.). New York: PublicAffairs.

Munn, L. (2020). Staying at the Edge of Privacy: Edge Computing and Impersonal Extraction. Media and Communication, 8(2), 270–279. https://doi.org/10.17645/mac.v8i2.2761

Mühlhoff, R. (2018). Digitale Entmündigung und User Experience Design. Wie digitale Geräte uns nudgen, tracken und zur Unwissenheit erziehen. Leviathan, 46(4), 551–574. https://doi.org/10.5771/0340-0425-2018-4-551

Nadler, J. & Cicilline, D. (2020). Investigation of competition in digital markets. Verfügbar unter: https://web.archive.org/web/20221226015935/https://judiciary.house.gov/uploadedfiles/competition_in_digital_markets.pdf

Natale, S. & Cooke, H. (2020). Browsing with Alexa: Interrogating the impact of voice assistants as web interfaces. Media, Culture & Society, 43(6), 1000–1016. https://doi.org/10.1177/0163443720983295

Natale, S. & Guzman, A. L. (2022). Reclaiming the human in machine cultures: Introduction. Media, Culture & Society, 44(4), 627–637. https://doi.org/10.1177/01634437221099614

Neville, S. J. (2020). The domestication of privacy-invasive technology on YouTube: Unboxing the Amazon Echo with the online warm expert. Convergence: The International Journal of Research into New Media Technologies, 27(5), 1288–1307. https://doi.org/10.1177/1354856520970729

Ojeda, C. (2021). The Political Responses of Virtual Assistants. Social Science Computer Review, 39(5), 884–902. https://doi.org/10.1177/0894439319886844

Pascal. (2023). Amazon 1-Click and the Value of Broken Infrastructure. In P. Smith, A. Monea & M. Santiago (Hrsg.), Amazon: at the intersection of culture and capital (S. 101–114). Lanham: Rowman & Littlefield.

Phan, T. (2019). Amazon Echo and the Aesthetics of Whiteness. Catalyst: Feminism, Theory, Technoscience, 5(1), 1–38. https://doi.org/10.28968/cftt.v5i1.29586

Plantin, J.-C., Lagoze, C., Edwards, P. N. & Sandvig, C. (2018). Infrastructure studies meet platform studies in the age of Google and Facebook. New Media & Society, 20(1), 293–310. https://doi.org/10.1177/1461444816661553

Porcheron, M., Fischer, J. E., Reeves, S. & Sharples, S. (2018). Voice Interfaces in Everyday Life. In Proceedings of the 2018 CHI Conference on Human Factors in Computing Systems - CHI ’18 (S. 1–12). Montreal QC, Canada: ACM Press. https://doi.org/10.1145/3173574.3174214

Pridmore, J. & Mols, A. (2020). Personal choices and situated data: Privacy negotiations and the acceptance of household Intelligent Personal Assistants. Big Data & Society, 7(1), 1–13. https://doi.org/10.1177/2053951719891748

Reeves, S., Fischer, J. E., Porcheron, M. & Sikveland, R. (2019). Learning how to talk: Co-producing action with and around voice agents. In Proceedings of the Mensch und Computer 2019 Workshop on Interacting with Robots and Virtual Agents (S. 362–363). München. https://doi.org/10.18420/muc2019-ws-654

Ricci, F., Rokach, L. & Shapira, B. (2015). Recommender Systems: Introduction and Challenges. In F. Ricci, L. Rokach & B. Shapira (Hrsg.), Recommender Systems Handbook (S. 1–34). Boston, MA: Springer US. https://doi.org/10.1007/978-1-4899-7637-6_1

Rowberry, S. P. (2022). Four shades of gray: the amazon kindle platform (Platform studies). Cambridge, Massachusetts: The MIT Press.

Sadowski, J. (2019). When data is capital: Datafication, accumulation, and extraction. Big Data & Society, 6(1), 1–12. https://doi.org/10.1177/2053951718820549

Sadowski, J. (2020). Too smart: how digital capitalism is extracting data, controlling our lives, and taking over the world. Cambridge, Massachusetts: MIT Press.

Sadowski, J., Strengers, Y. & Kennedy, J. (2021). More work for Big Mother: Revaluing care and control in smart homes. Environment and Planning A: Economy and Space, Online First. https://doi.org/10.1177/0308518X211022366

Shove, E. (2003). Comfort, cleanliness and convenience: the social organization of normality (New technologies, new cultures) (1. publ.). Oxford: Berg.

Slota, S. C. & Bowker, G. C. (2017). How Infrastructures Matter. In U. Felt, R. Fouché, C.A. Miller & L. Smith-Doerr (Hrsg.), The handbook of science and technology studies (Fourth edition., S. 529–554). Cambridge, Massachusetts: The MIT Press.

Soffer, O. (2020). From textual orality to oral textuality: The case of voice queries. Convergence: The International Journal of Research into New Media Technologies, 26(4), 927–941. https://doi.org/10.1177/1354856519825773

Srnicek, N. (2017). Platform capitalism (Theory redux). Cambridge, UK ; Malden, MA: Polity.

Srnicek, N. (2022). Data, Compute, Labor. In M. Graham & F. Ferrari (Hrsg.), Digital Work in the Planetary Market (S. 241–261). The MIT Press. https://doi.org/10.7551/mitpress/13835.001.0001

Star, S. L. (1999). The Ethnography of Infrastructure. American Behavioral Scientist, 43(3), 377–391. https://doi.org/10.1177/00027649921955326

Star, S. L. & Ruhleder, K. (1996). Steps Toward an Ecology of Infrastructure: Design and Access for Large Information Spaces. Information Systems Research, 7(1), 111–134. https://doi.org/10.1287/isre.7.1.111

Starosielski, N. (2015). The undersea network (Sign, storage, transmission). Durham: Duke University Press.

Stilgoe, J. (2018). Machine learning, social learning and the governance of self-driving cars. Social Studies of Science, 48(1), 25–56. https://doi.org/10.1177/0306312717741687

Stone, B. (2021). Amazon unbound: Jeff Bezos and the invention of a global empire (Second.). New York: Simon & Schuster.

Strengers, Y., Hazas, M., Nicholls, L., Kjeldskov, J. & Skov, M. B. (2020). Pursuing pleasance: Interrogating energy-intensive visions for the smart home. International Journal of Human-Computer Studies, 136. https://doi.org/https://doi.org/10.1016/j.ijhcs.2019.102379

Strengers, Y. & Kennedy, J. (2020). The smart wife: why Siri, Alexa, and other smart home devices need a feminist reboot. Cambridge, Massachusetts: The MIT Press.

Strengers, Y. & Nicholls, L. (2017). Convenience and energy consumption in the smart home of the future: Industry visions from Australia and beyond. Energy Research & Social Science, 32, 86–93. https://doi.org/10.1016/j.erss.2017.02.008

Strüver, N. (2023). Digital Culture & Society, 9(1), 99–124. https://doi.org/doi:10.14361/dcs-2023-0106

Sætra, H. S., Coeckelbergh, M. & Danaher, J. (2022). The AI ethicist’s dilemma: fighting Big Tech by supporting Big Tech. AI and Ethics, 2(1), 15–27. https://doi.org/10.1007/s43681-021-00123-7

Thylstrup, N. B., Hansen, K. B., Flyverbom, M. & Amoore, L. (2022). Politics of data reuse in machine learning systems: Theorizing reuse entanglements. Big Data & Society, 9(2). https://doi.org/10.1177/20539517221139785

Waldecker, D., Hector, T. & Hoffmann, D. (2023). Intelligent Personal Assistants in practice. Situational agencies and the multiple forms of cooperation without consensus. Convergence: The International Journal of Research into New Media Technologies, Online First. https://doi.org/10.1177/13548565231189584

Waldecker, D. & Hector, T. M. (2023). A Praxeological Approach Towards the Domestication of Connected Media Technologies. Digital Culture and Society, 6(1), 5–22. https://doi.org/10.14361/dcs-2023-0102

Waldecker, D. & Hoffmann, D. (2023). Zur Inszenierung von kritischen Kompetenzen in Nischenöffentlichkeiten: Bewertungen von Smart Speakern auf YouTube. kommunikation@gesellschaft, 23(1). https://doi.org/10.15460/kommges.2022.23.1.1000

Waldecker, D. & Volmar, A. (2022). Die zweifache akustische Intelligenz virtueller Sprachassistenten zwischen verteilter Kooperation und Datafizierung. In A. Schürmer, M. Haberer & T. Brautschek (Hrsg.), Acoustic Intelligence (S. 161–182). De Gruyter. https://doi.org/10.1515/9783110730791-011

Wang, B., Luo, L. & Wang, X. (2023). „Back to the living room era“: Smart speaker usage and family democracy from the family dynamic perspective. New Media & Society, Online First. https://doi.org/10.1177/14614448231155624

Weidmüller, L., Etzrodt, K., Löcherbach, F., Möller, J. & Engesser, S. (2021). ICH HÖRE WAS, WAS DU NICHT HÖRST - Medienvielfalt und Transparenz bei Sprachassistenten. Düsseldorf: Landesanstalt für Medien NRW. Verfügbar unter: https://www.medienanstalt-nrw.de/presse/pressemitteilungen-2021/2021/default-2cf84ce7c6.html

Weigel, M. (2023). Amazon’s Trickle-Down Monopoly: Third-Party Sellers and the Transformation of Small Business. Data & Society Research Institute. https://doi.org/10.2139/ssrn.4317167

West, E. (2022). Buy now: how Amazon branded convenience and normalized monopoly (Distribution matters). Cambridge: The MIT Press.

Zurawski, N. (2021). Überwachen und konsumieren: Kontrolle, Normen und soziale Beziehungen in der digitalen Gesellschaft (Sozialtheorie) (1. Auflage). Bielefeld, Germany: transcript Verlag. https://doi.org/10.14361/9783839456064


  1. Die Begriffe IPA, Sprachassistent, Alexa, Echo, oder Smart Speaker werden im Folgenden synonym verwendet. Es ist jedoch wichtig, diese initial voneinander abzugrenzen: Im hier behandelten Fall läuft die Sprachassistenzsoftware Alexa auf Echo-Geräten wie z.B. Lautsprecherboxen und anderen Geräten, wie z.B. Türklingeln, oder Kameras. Diese Kombination aus Soft- und Hardware stellt letztlich den Smart Speaker dar. Die feminin konnotierte Bezeichnung des Assistenten als „Alexa“, soll losgelöst von geschlechterspezifischen Konnotationen (Strengers & Kennedy, 2020) betrachtet werden, da vordergründig die Rede von Alexa als Plattformtechnologie ist.↩︎

  2. Über den Gegenstand dieses Artikels hinaus seien aufgrund des gesellschaftlichen Gewichts der Argumente besonders die Auseinandersetzungen mit Geschlechterfragen (z.B. Strengers & Kennedy, 2020) und die Bedeutung von Ethnie und Klasse (z.B. Phan, 2019) im Kontext von Sprachassistenten erwähnt.↩︎

  3. AWS ist inzwischen Amazons umsatzstärkstes Produkt und bietet die Cloud- und Recheninfrastruktur für eine Vielzahl an Firmen aus diversen Bereichen (Nadler & Cicilline, 2020, S. 248f.). Durch Nutzung der AWS Cloud kann ein Geschäftspartner seine Softwareinfrastruktur mithilfe dieser Cloud-Services abbilden und muss keine eigenen Server und Rechenzentren betreiben.↩︎

  4. Amazon.com bietet unter dem Konzept des Marketplaces auch Drittanbietern die Möglichkeit ihre Produkte auf der Plattform zu verkaufen, sodass Amazon mit ihnen in Konkurrenz tritt. Dieses Konkurrenzverhältnis wird von vielen Parteien aufgrund von undurchsichtigen Algorithmen und Markttechnologien, die Selbstbevorzugung und ungleiche Machtverhältnisse zu Gunsten Amazons ermöglichen, kritisch betrachtet (European-Commission, 2022; Khan, 2018, S. 780f.).↩︎

  5. Dieser Interaktionsbegriff ist bewusst flach gewählt und geht von einer Interaktionskapazität bzw. Agency der Technik aus (Slota & Bowker, 2017, S. 535). Implikationen, Bedingungen und Eigenschaften dieses Interaktionsbegriffs liegen jedoch außerhalb des Erkenntnisinteresses.↩︎

  6. Dieses Modell ist notwendigerweise vereinfacht und blendet zentrale Aspekte digitaler Technologien aus, die es kritisch zu hinterfragen gilt, z.B. die Bedeutung, Verarbeitung, Aufbereitung, und Verwendung von Daten (vgl. dazu z.B. boyd & Crawford, 2012; Burrell & Fourcade, 2021; Srnicek, 2022). Dies dient der Veranschaulichung der Prozesse, in die Alexa eingebunden ist, und dem Verständnis der Bedeutung der involvierten Parteien sowie deren Interdependenzen.↩︎

  7. Machine Learning beschäftigt sich mit der Entwicklung von Algorithmen, die es Computersystemen ermöglichen, aus Daten zu lernen und Entscheidungen zu treffen, ohne explizit von Menschen programmiert zu werden. Deep Learning wiederum ist eine Unterart des Machine Learnings und lernt quasi selbstständig mit limitierter menschlicher Kontrolle auf Basis von möglichst großen Datensätzen, um künstliche neuronale Netze zu entwickeln, die spezifische Probleme lösen. Deep Learning wird hauptsächlich für die Lösung komplexer Probleme wie Computer Vision und Spracherkennung verwendet. Eine detaillierte soziologische Analyse algorithmischer Entwicklungsverfahren und deren Konsequenzen ist an dieser Stelle nicht zielführend (vgl. aber z.B. Mackenzie, 2017; Amoore, 2023; Stilgoe, 2018). Es sei lediglich betont, dass viele dieser Verfahren für Menschen undurchschaubare Logikketten entwickeln, sodass oft opak ist, wie die Outputs zustande kommen (Burrell, 2016). Entsprechend werden solche Algorithmen zunehmend unter ethischen Perspektiven betrachtet, die z.B. Marginalisierung und Diskriminierung durch KI vorbeugen bzw. aufdecken sollen (siehe z.B. Sætra, Coeckelbergh & Danaher, 2022). Hierbei ist jedoch zu erwähnen, dass gerade die großen Technologiekonzerne diese Forschung stark finanzieren, um möglicherweise die Bewertung ihrer Produkte zu beeinflussen, sodass letztlich die ethischen Stand- und Kritikpunkte mit ihren ökonomischen Interessen übereinstimmen können (Egliston & Carter, 2022, S. 12).↩︎

  8. Produktvorschläge bieten ein anschauliches Beispiel: Akkurate Daten sind essenziell für die Wissensbasis und Konstruktion von Empfehlungsalgorithmen (z.B. für Onlinehandel oder Streamingdienste). Diese werden eingesetzt, um Nutzer:innen relevante Items zu empfehlen – wie geeignete Websites, Bücher, Produkte oder Musik. Sie lernen meistens durch aktive Bewertungen (z.B. in Form von Sternen für ein Produkt), der Nutzer:innen (Cantador, Fernández-Tobías, Berkovsky & Cremonesi, 2015). Durch Sprachassistenten können alltägliche Anfragen und Interessen beiläufig als Datenpunkte interpretiert und ein vollständigeres Bild gewonnen werden, welches nicht nur von den Bewertungen abhängt, für die die Nutzer:in sich aktiv entschieden hat.↩︎

  9. Auf einen Rückbezug auf Zuboffs Behavioral Surplus-Begriff wird hier bewusst verzichtet, da eine Vielzahl der damit einhergehenden Annahmen nicht geteilt werden.↩︎

  10. Die Verflechtungen zwischen Alexa, den unterschiedlichen Diensten und der zunehmend selbstverständlichen Nutzung werfen Fragen auf, die aus Überwachungs- und Privatsphärenperspektive kritisch diskutiert werden, etwa bei Maalsen und Sadowski Maalsen & Sadowski (2019), Mols et al. (2021), West (2022, S. 114–133) oder Brause & Blank (2023), im Rahmen dieses Beitrags aber nicht weiter verfolgt werden können.↩︎

Downloads

Zitationen
0
0
0 von Crossref erfasste Zitate
0 von Semantic Scholar erfasste Zitate
Metriken
Views/Downloads
  • Abstract
    417
  • PDF
    245
  • HTML
    1
Weitere Informationen

Erhalten

2023-05-19

Akzeptiert

2023-11-17

Veröffentlicht

2023-11-24

Funding data