„Nuit, correspondance, sentiment”

Topic Modeling auf einem Korpus von französischen Romanen 1750-1800

Autor/innen

DOI:

https://doi.org/10.15460/apropos.9.1888

Schlagwörter:

18. Jahrhundert, Französische Literatur, Topic Modeling, Linked Open Data, Wikidata

Abstract

Wie lassen sich romanistische Korpora hinsichtlich ihrer literarischen Themen mit digitalen Methoden explorativ erforschen? Im Kontext des Verbundprojekts „Mining and Modeling Text” wurde Topic Modeling mit MALLET (McCallum 2002) auf ein Korpus von 80 französischen Romanen aus der Zeit von 1750 bis 1800 (Röttgermann et al. 2020) angewandt. Ziel des Topic Modeling-Ansatzes ist es dabei, Aussagen über die Themen von Werken zu treffen, die in Form von RDF-Tripeln in ein auf Wikibase basierendes Wissensnetzwerk einfließen. Die über­geordnete, interdisziplinäre und neuartige Idee ist es dabei, datenbasierte Literatur­­geschichtsschreibung zu betreiben. Neben der Informationsextraktion aus Primärtexten speist sich das Wissensnetzwerk auch aus bereits digitalisierten biblio­graphischen Daten (Martin, Mylne & Frautschi 1977; Lüschow 2019). Im Zusammenspiel dieser beiden Informationsflüsse lässt sich über ein gemeinsames kontrolliertes Vokabular ein aufschlussreicher Datenabgleich vollziehen: Welche Themen der Werke wurden durch die Bibliograph:innen identifiziert und welche Topics treten durch den Topic Modeling-Algorithmus zutage? Zwei Fallstudien zu Choderlos de Laclos und Xavier de Maistre exemplifizieren die Vorgehensweise und das Potential dieses Ansatzes.

Autor/innen-Biografien

  • Anne Klee, Trier Center for Digital Humanities

    Anne Klee ist wissenschaftliche Mitarbeiterin am Trier Center for Digital Humanities der Universität Trier. Im Projekt „Mining and Modeling Text“ arbeitet sie mit an der Entwicklung eines Wissensnetzwerkes zur französischen Literaturgeschichtsschreibung.

     

  • Julia Röttgermann, Trier Center for Digital Humanities

    Julia Röttgermann arbeitet am Trier Center for Digital Humanities der Universität Trier im Projekt „Mining and Modeling Text“. Sie ist dort verantwortlich für den Aufbau eines Korpus’ französischer Romane der zweiten Hälfte des 18. Jahrhunderts in XML/TEI (Röttgermann et al. 2020) und für die Analyse dieses Korpus’ mit Hilfe verschiedener Text Mining-Verfahren wie Topic Modeling, Named Entity Recognition, Text Reuse und Sentiment Analysis.

     

     

Downloads

Zitationen
1
0
1 von Crossref erfasste Zitate
  
  1. Stylometry and Knowledge Graphs: Authorship Attribution of a French Erotic Novel at the Turn of the Century: L’enfant du bordel (1800)
    Julia Röttgermann et al. (2025)
    Romanica Cracoviensia
    DOI: 10.4467/20843917RC.25.040.22753

0 von Semantic Scholar erfasste Zitate
Metriken
Views/Downloads
  • Abstract
    597
  • PDF
    497
Weitere Informationen

Erhalten

2022-03-07

Veröffentlicht

2022-12-13

Zitation

[1]
2022. „Nuit, correspondance, sentiment”: Topic Modeling auf einem Korpus von französischen Romanen 1750-1800. apropos [Perspektiven auf die Romania]. 9 (Dez. 2022), 57–86. DOI:https://doi.org/10.15460/apropos.9.1888.