CTRL + F

Eine Suchmaschine für die Quellenarbeit bauen

Machine-readable full text and bibliographic details for the 2020 etü article.
Veröffentlichungsdatum

September 2020

Diese Seite bietet die kanonische DOI, eine maschinenlesbare Volltextversion für bessere Auffindbarkeit.

Zitierangaben

Downloads

Volltext (maschinell extrahiert)

Der folgende Volltext wurde aus der PDF-Version extrahiert, um die Indexierung in Suchmaschinen und KI-gestützten Systemen zu verbessern. Für Zitierungen gilt weiterhin die Verlagsfassung unter der DOI.

                                                                                                ETH Library




CTRL + F. Eine Suchmaschine für
die Quellenarbeit bauen


 Journal Article

 Author(s):
 Mähr, Moritz

 Publication date:
 2020-09

 Permanent link:
 https://doi.org/https://doi.org/10.3929/ethz-b-000449830

 Rights / license:
 In Copyright - Non-Commercial Use Permitted

 Originally published in:
 Etü 2020(2)




 This page was generated automatically upon download from the ETH Zurich Research Collection.
 For more information, please consult the Terms of use.
                                  Historiker*innen - Zeitschrift
                                  Elfenbeintürmer / Historisches Seminar /
                                  Universität Zürich / Herbstsemester 2020




     «Wir haben gehofft, dass uns keiner verrät»
Eine polnische Familie erzählt von der Wende

     Urlaubsparadies für US-Soldaten
Die Schweiz im Umbruchsjahr 1945

     #ChileDespertó
Reportage aus einem Land in Aufruhr
UMBRUCH
«WIR ERZÄHLEN STUDIERENDEN DINGE, AN DIE WIR LÄNGST NICHT MEHR GLAUBEN»                                                06
Ein Gespräch über das Denken in Umbrüchen mit Brigitta Bernet, Claudia Opitz-Belakhal und Anja Rathmann-Lutz

COMPUTERLIEBE: DEKONSTRUKTION EINES UMBRUCHNARRATIVS                                                                   12
Von Anne-Christine Schindler

ÜBER UMWEGE AUS DEM KOMMUNISMUS: ERINNERUNGEN EINER POLNISCHEN FAMILIE                                                 15
Von Jana Kierysch

EINSAME GALAXIE, SINNHAFTE LINIE: WIE SICH DIE GRENZEN VON LEBEN UND TOD VERSCHIEBEN                                   18
Von Sophia Bosshard und Mira Imhof

TOO MUCH INFORMATION! JOURNALISMUS IM INTERNETZEITALTER                                                                25
Von Elena D’Amato

VOM STEIGBÜGEL ZUM SEGWAY                                                                                              28
Die etü-Redaktion über Dinge, die die Welt revolutionierten – oder auch nicht

ANNE BOLEYN: EINE GESCHICHTE ÜBER MYTHEN, TOD UND TV-SERIEN                                                            32
Von Antonia Schulte-Brinkmann

SIGMUND FREUD: DIE DRITTE KRÄNKUNG DER MENSCHHEIT?                                                                     36
Kommentar von Carla Burkhard

DER AKKORD FÜR EIN ENDENDES JAHRHUNDERT: WAGNERS PLATZ IN DER MUSIKGESCHICHTE                                          38
Von Konstantin Bosshard

DER «BACILLENTÖDTER»: ÜBER RASSISTISCHE METAPHERN IN DER BAKTERIOLOGIE                                                 40
Von Elia Stucki

«SCHRECK VON DRÜBEN»: SPRECHEN ÜBER AIDS UND SEINE FOLGEN                                                              42
Von Julia Vetter

GEFANGEN IN FRANÇAFRIQUE: KONTINUITÄTEN IM KOLONIALEN ERBE                                                             45
Von Kai Kersten

DAS LETZTE GEFECHT DER HONGKONGER MILLENNIALS: PERSPEKTIVEN AUS DER DIASPORA                                           48
Von Manuel Kissóczy

VON RÖHRLIJEANS UND BRUTKÄSTEN                                                                                         52
Umbrüche im Leben der etü-Redaktion

ALS DER FILM ZU SPRECHEN BEGANN: EINE ZÄHE ERFOLGSSTORY                                                                57
Von Simon Eugster


4                                                                                                              etü HS 2020
#CHILEDESPERTÓ: REPORTAGE AUS EINEM LAND IN AUFRUHR                               60
Von Nuria Piller

KÄMPFE, WO DU STEHST! REVOLUTIONSTHEORIEN MIT (POST)KOLONIALEM VORDERGRUND        64
Von Helena Dobiess und Kai Kersten

GEISTREICH: WIE DER DEUTSCHE IDEALISMUS UNSER DENKEN VERÄNDERT HAT                68
Von Michael D. Schmid

«DIE HARMLOSE INVASION»: YANKEES EROBERN DIE SCHWEIZ                              72
Von Menoa Stauffer

IM KRIEG GEBOREN: DIE ERSTE AKTIENGESELLSCHAFT DER WELT                           75
Von Sven Bonnard

SOLLEN SIE FALLEN? EINE AUSEINANDERSETZUNG MIT CECIL RHODES                       78
Kommentar von Giorgio Scherrer


HISTORIKER IM BERUF
«IN JEDEM VON UNS STECKT EIN BRUNO MANSER»                                        80
Interview mit Lukas Straumann von Antonia Schulte-Brinkmann und Carla Burkhard


FORSCHUNG
CARE-ARBEIT AM FÜRSTENHOF? EINE SPURENSUCHE NACH DEM FRAUEN*STREIK                85
Von Livia Merz

CTRL + F: EINE SUCHMASCHINE FÜR DIE QUELLENARBEIT BAUEN                           88
Von Moritz Mähr

HISTORISCHES SEMINAR
EIN JAHR ZEITGESCHICHTE: STUDIS ZIEHEN BILANZ                                     92
Von Giorgio Scherrer


ALUMNI                                                                            96


KLASSIKER DER GESCHICHTSSCHREIBUNG
VERZERRUNG UND VERSCHWÖRUNG: GESCHICHTE DER HOLOCAUSTLEUGNUNG                     98
Von Konstantin Bosshard


REZENSION
WAS TUN MIT SCHMUTZIGEM GELD? VOM SCHWEIZER UMGANG MIT POTENTATENGELDERN         100
Von Christian Schäpper


IMPRESSUM                                                                        101


MENSCHEN AM HS
«DIE ÄRA METZGER»                                                                102
Die Bibliothekarin Barbara Metzger, aufgezeichnet von Giorgio Scherrer


etü HS 2020                                                                        5
FORSCHUNG


CTRL+F: EINE SUCHMASCHINE FÜR
DIE QUELLENARBEIT BAUEN
Vor vier Jahren hat die Professur für Technikgeschichte an der ETH Zürich mit der Entwick-
lung einer Suchmaschine für Quellen aus dem Schweizerischen Bundesarchiv begonnen.
Was gilt es dabei zu bedenken? Und wie verändert eine solche Maschine Forschungsprakti-
ken? Ein Bericht über technische, organisatorische und fachliche Herausforderungen.




Von Moritz Mähr

Wenn Quellenarbeit und Suchmaschine im selben Satz er-           che, sondern auch Suchtreffer an die Höchstbietenden. Wie
wähnt werden, macht sich schnell Skepsis breit. Was haben        die Suchtreffer zustande kommen, legt Google nicht offen.
der Gang ins Archiv, die Konsultation der Findmittel, die        Welche Seiten indiziert werden, welche als relevant gelten
Transliteration, das Close Reading, die Kritik oder die Ausle-   und welche Google ignoriert, ist nicht ersichtlich. Dazu
gung einer Quelle mit einer kinderleicht zu bedienenden Ma-      kommt, dass basierend auf dem Persönlichkeitsprofil, das
schine zu tun? Oft nicht viel. Das lernen die meisten Student-   Google über jede Benutzer*in angelegt hat, die Suchresultate
*innen spätestens mit der ersten ausschliesslich auf Google      variieren. Solche Suchresultate kann man weder reproduzie-
Search basierenden Semesterarbeit, die dem Rotstift der Be-      ren noch nachvollziehen. Sie sind für die wissenschaftliche
treuer*in zum Opfer gefallen ist und nochmals geschrieben        Arbeit ungeeignet.
werden muss. Einer gewissenhaften Historiker*in ist klar, dass     Ein ganz anderes Bild zeigt sich, wenn man die physischen
die Abfrage einer Suchmaschine nur ein erster Schritt einer      Anlaufstellen recherchierender Historiker*innen – Archive, Bi-
Recherche sein kann. Danach muss man die Ergebnisse der          bliotheken, Sammlungen etc. – in den Blick nimmt. Die oft-
Abfrage einordnen, kritisch hinterfragen und mit der Fachlite-   mals öffentlich finanzierten Gedächtnisinstitutionen und ihre
ratur (aus einer Bibliothek) und Quellen (aus einem Archiv)      Dienstleistungen stehen Google diametral gegenüber. Sie
abgleichen. Sich blind auf eine Suchmaschine zu verlassen, ist   verfügen über einen klaren Auftrag und geregelte Prozedu-
unwissenschaftlich.                                              ren. Reproduzierbare und nachvollziehbare «Suchergebnis-
                                                                 se» gehören genauso zu ihren Kernaufgaben wie die Pflege
Google ist kein wissenschaftliches Werkzeug                      und Erweiterung des Bestandes. Sie sind oft so organisiert,
Dass viele Historiker*innen zuerst einmal irritiert sind, wenn   dass die Signatur nicht nur den Standort der Archivale, son-
man in Bezug auf ihr Fach von Suchmaschinen spricht, liegt       dern auch etwas über den Entstehungszusammenhang des
unter anderem daran, dass uns bei diesem Wort nicht profes-      Archivguts preisgibt. Die Archivar*innen des Bundesarchivs
sionelle historische Findmittel wie der Bibliothekskatalog       Bern entnehmen der Signatur E4268-06#2007/112#22*, dass
swissbib.ch oder die Archivplattform archives-online.org vor     es sich um ein Dossier (*) aus dem Teilbestand des Bundes-
dem geistigen Auge erscheinen, sondern Google. Google            amts für Polizei (4268-06) handelt. Der Teilbestand wiederum
lässt viele Eigenschaften eines seriösen, wissenschaftlichen     gehört zum Bestand des Bundesstaats seit 1848 (E). Die Find-
Werkzeugs vermissen: Google verkauft nicht nur Anzeigeflä-       mittel des Archivs sind keine Suchmaschinen, die unstruktu-


88                                                                                                                 etü HS 2020
                                                                                                               FORSCHUNG

rierte Inhalte des Archivguts aufbereiten, sondern Wissens-       meln. Dazu müssen die Eingabedaten – die Text- und Zei-
speicher einer Ordnungsleistung des Archivs.                      chenerkennung der Dokumente (OCR) – von hoher Qualität
                                                                  sein. Die Texterkennung scheitert jedoch in vielen Dokumen-
Digitalisierung macht auch vor dem Bundesarchiv nicht Halt        ten an der Materialität der Quellen. Mehrsprachige Doku-
Mit den sich wandelnden Medienkonsumgewohnheiten der              mente, Helvetismen, vergilbtes Papier, ungewöhnliche
Benutzer*innen und den sinkenden Kosten für Speicherplatz         Schreibmaschinentypen und handschriftliche Notizen er-
und Breitbandanschlüsse verändern sich auch die Archive           schwerten die OCR-Texterkennung.
und ihre Findmittel. So bietet beispielsweise das Bundesar-
chiv seit Ende 2019 zentrale Dienstleistungen online an: Ar-       Angaben zum Autor
chivalien können über eine Website bestellt werden und Di-         Moritz Mähr ist wissenschaftlicher Mitarbeiter an der Pro-
gitalisate stehen «on-demand» nach einigen Sekunden oder           fessur für Technikgeschichte der ETH Zürich und am
– falls sie noch digitalisiert werden müssen – nach einigen Ta-    Collegium Helveticum. Er studierte Wissensgeschichte
gen zum kostenlosen Download bereit. Momentan ist erst ein         und -philosophie, Informatik und Banking & Finance in
Bruchteil des riesigen Archivs online verfügbar, bis Ende der      Zürich und Berlin. Zurzeit arbeitet er an einer Dissertation
2020er Jahre sollen jedoch sämtliche Dossiers online konsul-       zur Digitalisierung der Migrationsbehörden in der
tiert werden können.                                               Schweiz, die Teil des vom SNF finanzierten Projekts «Aus-
   Als David Gugerli, Professor für Technikgeschichte an der       handlungszonen» ist. Seine Forschungsinteressen umfas-
ETH Zürich, 2015 mit dem Bundesarchiv eine Forschungsko-           sen Computergeschichte, Migrations Studies und Digital
operation einging und mehrere Dutzend Dossiers von meh-            History.
reren Hundert Seiten bestellte, war die Digitalisierung von Ar-
chivgut nicht nur mit viel kostspieliger Handarbeit, sondern      Die Ergebnisse des Topic Modellings waren für die am Pro-
auch mit logistischen Herausforderungen verbunden. Über           jekt beteiligten Historiker*innen deshalb in den meisten Fäl-
90 Gigabytes an PDF-Dateien mussten auf USB-Sticks gespei-        len nicht sehr aufschlussreich. Um trotzdem mit den Quellen
chert und per Einschreiben verschickt werden. In Zürich an-       arbeiten zu können, griffen sie auf bewährte Strategien zu-
gekommen drängte sich die Frage auf, wie sich eine Handvoll       rück: Sie sortierten die Dateien und Ordner nach den Äm-
Historiker*innen in vernünftiger Zeit einen Überblick über 90     tern, aus denen sie stammten, und versahen sie mit den An-
Gigabyte Akten verschaffen könnten.                               gaben über den Entstehungskontext (wie Entstehungszeit
                                                                  und Dossiertitel) aus dem Archivplan. So war bereits vor dem
Die Maschine scheitert an widerspenstigen Quellen                 Öffnen der Datei ersichtlich, von wem und aus welcher Zeit
Zusammen mit den ETH Scientific IT Services (SIS) suchte man      eine Quelle stammte. Auf dieser Basis wurde eine Datenbank
nach Lösungen, um die Datenmenge zu bewältigen. Für eine          angelegt, in der die in den Quellen enthaltenen Texte ge-
erste Analyse sollten die in den Quellen enthaltenen Schrift-     speichert und die häufigsten Fehler der Texterkennung be-
zeichen eingelesen und die Dokumente in verschiedene the-         reinigt wurden. Mit der Volltextsuche der Dokument-Daten-
matische Cluster aufgeteilt werden. Dafür wurde Topic Mo-         bank stiess man nun auch in Dossiers, die sich über mehrere
delling eingesetzt, eine verbreitete Methode zur                  Dutzend PDF-Dateien erstreckten, schnell auf interessante
maschinellen Textanalyse. In einem ersten Schritt schätzten       Textstellen. Bei der Textstelle angekommen, konnte man
die Informatiker*innen die Anzahl der vermuteten themati-         wieder auf bewährte Methoden der historischen Quellenar-
schen Cluster ab, dann berechnete der Algorithmus für jedes       beit wie das Close Reading zurückgreifen.
Dokument die Wahrscheinlichkeit, zu einem oder mehreren
Clustern zu gehören. Bestenfalls generiert der Algorithmus        Wie kommt das Wissen aus dem Archiv in die Suchmaschine?
für jeden thematischen Cluster eine Liste von Wörtern, die für    Die Volltextsuche der Dokument-Datenbank hatte aber auch
menschliche Betrachter*innen intuitiv Sinn ergeben: Versi-        ihre Tücken. Der Archivkontext – also welches Dossier vor
cherung, Renten, Sicherheit, System, Abkommen, Arbeitneh-         oder nach dem gefundenen Dossier im Bestand war – ging
mer etc. Im schlechtesten Fall gruppiert der Algorithmus          genau so verloren wie die Einheit des Dossiers selbst, das
Wörter, die eine ähnliche Verteilung über die Dokumente auf-      über mehrere PDF-Dateien verteilt keinen immanenten Zu-
weisen, aber keinen Aufschluss über die Bedeutung des Clus-       sammenhang mehr zu haben schien. Dass die Texterken-
ters geben: der, hier, dort, das etc.                             nung aus einem «w» ein «vi» machte oder Briefköpfe gänzlich
  Hinter den Wortlisten steckt eine nicht unproblematische        ignorierte, erschwerte die Arbeit zusätzlich.
Annahme aus der Wortsemantik: Wörter sind die zentralen             Um brauchbare Ergebnisse zu liefern, musste eine andere
Bedeutungsträger und Wörter mit einer ähnlichen statisti-         Suchmaschine her. Sie sollte mit einer schlechten Texterken-
schen Verteilung haben eine ähnliche Bedeutung. Bei perfekt       nungsrate umgehen und den Inhalt sowie die Metadaten – das
transkribierten und ausreichend homogenen Texten liefert          Wissen über die Quellen aus dem Archiv – sinnvoll verbinden
die Methode Cluster, die Dokumente mit ähnlichem Inhalt           können. Zudem sollte sie an Erkenntnispraktiken anschliessen,
oder ähnlichen Strukturmerkmalen (Textsorten etc.) versam-        die den Historiker*innen vertraut waren. Die Wahl fiel 2018


etü HS 2020                                                                                                                  89
FORSCHUNG




Die Suchmaschine Open Semantic Search (OSS) macht das Leben einfacher. Schneller bei der gesuchten Quelle zu sein ist praktisch, macht aber die auf-
wendige Quellenarbeit nicht hinfällig.

auf Open Semantic Search (OSS). OSS ist eine freie Software,                gung des Einsichtsgesuchs aufgeführt waren. Es musste ge-
entwickelt vom Berliner Investigativjournalisten Markus                     währleistet sein, dass die Software auch dann stabil war, wenn
Mandalka und ausgerichtet auf die Bedürfnisse seines Meti-                  das ganze Team gleichzeitig damit arbeitete. Und nicht zuletzt
ers. Damit die Historiker*innen damit arbeiten konnten,                     mussten Suchverlauf und -ergebnisse – also einzelne PDF-Da-
mussten verschiedene Anpassungen vorgenommen werden:                        teien – gespeichert und wieder aufgerufen werden können.
Die automatische Texterkennung musste so eingestellt wer-
den, dass möglichst viele Mängel der historischen Quellen                   Die bessere Maschine: die Professur
bereits beim Einlesen der Datei ausgemerzt werden konnten.                  Wichtiger als die technischen Anpassungen der Software
Für jede Quelle wurden die korrespondierenden digitalen                     war, dass die Maschine an die Arbeitsabläufe der Historiker-
Metadaten aus dem Bundesarchiv geladen und in einem ge-                     *innen angepasst werden konnte. Dieser Arbeitsablauf
meinsamen Datensatz abgelegt – das erlaubt es bei Suchan-                   sieht in meinem Fall folgendermassen aus: Ausgehend von
fragen, die Logik des Archivplans mit der Volltextsuche zu                  einer Forschungsfrage grenze ich den Quellenbestand ein.
kombinieren. Darüber hinaus sollte die Suchmaschine das                     Ich tue das, indem ich nach bestimmten Begriffen suche,
Entstehungsdatum zu ermitteln versuchen, indem die erste                    mir einige Quellen anschaue und anschliessend die Such-
Datumsangabe aus dem Text ausgelesen wurde. Denn die                        abfrage weiter eingrenze. Sobald ich interessante Quellen
Metadaten aus dem Bundesarchiv geben lediglich eine Zeit-                   finde, erstelle ich Arbeitskopien oder Abschriften. Das er-
spanne an, in der das Dokument entstanden ist. Wenn sich                    laubt nicht nur das Verschlagworten und Exzerpieren, son-
dieser Zeitraum von 1953 bis 1988 erstreckt, ist es äusserst                dern auch die Katalogisierung in ein eigenes, der For-
praktisch zu wissen, dass diese konkrete Quelle aus dem Jahr                schungsfrage angepasstes Ordnungssystem. (Was darüber
1972 stammt.                                                                hinaus den Vorteil hat, dass die Quellen auch dann verfüg-
  Um die OSS-Suchmaschine wissenschaftlich nutzen zu kön-                   bar sind, wenn Internet, VPN oder Suchmaschine gerade
nen, reichten verbesserte Suchergebnisse aber nicht aus. Es                 den Dienst quittieren.) Wenn ich genug Material zusam-
musste sichergestellt werden, dass nur diejenigen Personen                  mengetragen habe, beginne ich die Puzzlestücke zusam-
auf die Dokumente zugreifen konnten, die in der Genehmi-                    menzufügen.


90                                                                                                                                    etü HS 2020
                                                                                                                      FORSCHUNG
Klar: Dieses Vorgehen macht nur Sinn, wenn es meinen Ar-            griffen und Filtereinstellungen einschränken und herunterladen.
beitsablauf beschleunigt oder bequemer macht. Die OSS-              An diesem Punkt steht die OSS-Suchmaschine heute. Das Korpus
Suchmaschine muss schnell sein und interessantere Treffer           – eine zentrale Eingangsvariable des Algorithmus – wird nun
generieren als die Suche auf meinem Mac. Dank eines Konfi-          durch das Wissen und die Forschungsintuitionen der Wissen-
gurationsfehlers tat sie das auch. Anstatt sich auf den Quel-       schaftler*innen vorstrukturiert und kontextualisiert. Die Rohtex-
lenordner zu beschränken, durchsuchte sie das gesamte               te kann man anschliessend in die Topic Modelling-Software
Netzlaufwerk der Professur. So tauchten neben den Quellen           DARIAH-DE TopicsExplorer einspielen. Die intuitive Oberfläche
auch Sekundärliteratur, Forschungs- und Lehrunterlagen              dieser Open Source-Software führt interaktiv durch die einzel-
der vergangenen zwei Jahrzehnte in den Suchresultaten               nen Arbeitsschritte und erlaubt es auch technisch weniger ver-
auf. Plötzlich wurde sichtbar, wer an ähnlichen Themen ar-          sierten Benutzer*innen, in kurzer Zeit Experimente mit Topic Mo-
beitet(e) und welcher Sekundärtext oder welches Archiv              delling durchzuführen.
hilfreich sein könnten. Ein wichtiger Teil des organisationa-
len Wissensspeichers – Quellentranskripte und Forschungs-               Awesome Digital History-Fundus
protokolle von Kolleg*innen – waren damit allen Mitarbeiter-
                                                                        Als Verfechter von Open Access und
*innen zugänglich.
                                                                        Open Source kuratiert Moritz Mähr
  Angeschlossen an das gesamte Netzlaufwerk der Profes-
                                                                        eine Liste mit den besten öffentlich zu-
sur erlaubte die OSS-Suchmaschine nicht nur einfache Su-
                                                                        gänglichen Tools, Quellensammlun-
chen und komplexe Nachforschungen nach bestimmten Be-
                                                                        gen und Plattformen.
griffen, sondern auch ein Stöbern im organisationalen
Wissensspeicher. Wie in einem Bibliothekskatalog liess sich
das gesamte Netzlaufwerk filtern nach Projekten, Lehrver-           Technische Fragen und inhaltliche Verschiebungen können so
anstaltungen, dem Enstehungszeitraum, der Sprache etc.              aufeinander bezogen und der Grundstein für die historische
Der neue Arbeitsmodus legte Querverbindungen zwischen               Operationalisierung des Topic Modellings gelegt werden: Wie
Quellen aus dem Bundesarchiv, Sekundärliteratur, For-               sehen die thematischen Cluster aus, wenn ich nach 15, 30 oder
schungs- und Lehrunterlagen offen und half die Menge an             50 Clustern suche? Wie verändert sich die Zusammensetzung
interessanten Dokumenten deutlich einzuschränken.                   der einzelnen Cluster, wenn die Quellen aus einem gewissen De-
  Aber selbst wenn man die Suche auf einige archivierte             partement oder aus einer gewissen Zeitspanne aus dem Korpus
Projekte und damit auf einige Promille des Gesamtbestan-            entfernt werden? Kann die Software dabei helfen, die für meine
des einschränkte, kamen schnell über 1’000 Dokumente zu-            Forschungsfrage relevanten Dokumente zu identifizieren?
sammen. Aufgrund dieser unüberschaubaren Textmenge                    Topic Modelling-Experimente mit den umfangreichen Be-
rückte die maschinelle Textanalyse wieder in den Fokus:             ständen aus dem Bundesarchiv laufen und fordern den For-
Könnte sie dabei helfen, diese synthetisch zusammenge-              scher*innen viel Lernbereitschaft und Geduld ab. Ob sich die
stellte Auswahl an heterogenen Dokumenten vorzusortie-              Methode etablieren wird, hängt nicht nur davon ab, ob und wie
ren und weiter einzuschränken?                                      man ihre Ergebnisse für die geschichtswissenschaftliche For-
                                                                    schung einsetzen kann. Vielmehr wird sich zeigen müssen, ob
Von der Suchmaschine zurück zum Experimentalsystem                  und wie das Topic Modelling an bereits bekannte Erkenntni-
Für die eingangs erwähnte maschinelle Textanalyse mittels To-       spraktiken anschliessen kann. Die Erfahrungen im Aufbau mit
pic Modelling wurde das gesamte Quellenkorpus aus dem Bun-          der OSS-Suchmaschine haben nämlich gezeigt, dass die digita-
desarchiv eingespielt und in 50 thematische Cluster aufgeteilt.     len Werkzeuge nur dann sinnvoll genutzt werden, wenn sie sich
Dabei wurden die Auswertungen zunächst zentralisiert von der        auf das Wissen und das Können der Benutzer*innen beziehen.
SIS vorgenommen und in Form von Ergebnistabellen an die For-
scher*innen weitergegeben. Aber diese statischen Artefakte
wurden dem experimentellen Charakter des Topic Modelling
nicht gerecht. Denn bereits kleine Veränderungen am Korpus
oder an der Anzahl der vermuteten thematischen Cluster kön-         Literatur
nen grosse Auswirkungen auf die «Sortierleistung» des Algorith-     •     Haber, Peter: «Google-Syndrom». Phantasmagorien des
mus haben. Um den Forscher*innen ein Werkzeug an die Hand                 historischen Allwissens im World Wide Web, in: Kilcher,
zu geben, das sich auch für historische Fragestellungen operati-          Andreas B. / Gugerli, David / Hirschi, Caspar u. a. (Hg.): Di-
onalisieren lässt, mussten sie selbst Experimente mit den Daten           gital humanities, Zürich 2013 (Nach Feierabend 9.2013),
durchführen können.                                                       S. 175–189.
  Damit die Historiker*innen sich mit den Topic Modelling-Expe-     •     Milligan, Ian: History in the age of abundance? How the
rimenten vertraut machen konnten, wurden mehrere Work-                    Web is Transforming Historical Research, Montreal 2019.
shops mit der SIS und der Professur für Technikgeschichte durch-    •     Putnam, Lara: The Transnational and the Text-Searchable.
geführt. Auch die OSS-Suchmaschine wurde angepasst: Nun                   Digitized Sources and the Shadows They Cast, in: The
lässt sich das Korpus für die maschinelle Textanalyse mit Suchbe-         American Historical Review 121:2, 01.04.2016, S. 377–402.


etü HS 2020                                                                                                                          91
IMPRESSUM


EIN SEMESTER IM UMBRUCH



Von Manuel Kissóczy

Was für ein Semester. Innerhalb von wenigen Wochen hatte         Redaktion                         Erscheinungsdatum
sich unser Leben grundlegend verändert. Die Stimme unse-         Carmen Bortolin                   Herbstsemester 2020
rer Dozierenden ertönte nun, verzerrt durch die Tücken der       Sven Bonnard
Videotelefonie, aus den Speakern unserer Laptops. Grup-          Carla Burkhard                    Auflage
penarbeiten wurden über Microsoft Teams koordiniert. Aus         Konstantin Bosshard               1200 Exemplare
gemütlichen Bier-Abenden im bqm wurden virtuelle Treffen         Sophia Bosshard
auf Zoom, kreative Hintergrundbilder ein Muss. Auch dieses       Elena D’Amato                     Preis
Heft nahm selbstverständlich seinen Anfang in mehrstündi-        Helena Dobiess                    Einzelpreis: Fr. 5.-
gen Zoom-Sitzungen. Die sich dauernd verändernden Um-            Simon Eugster                     Einzelversand: Fr. 10.-
stände beeinflussten schlussendlich neben einem Corona-          Brian Haimoff
Tagebuch auf unserer Website auch die Wahl des Heftthe-          Mira Imhof                        Gönnerabonnement
mas.                                                             Kai Kersten                       Fr. 20.- für ein Jahr
   Nach den ersten Lockerungen trafen wir uns im Juli für        Jana Kierysch                     Fr. 35.- für zwei Jahre
eine «Grillete» an der Limmat. Für die meisten von uns war       Manuel Kissóczy
es das erste grössere Treffen seit Mitte März, und wir freuten   Sebastian Leitner                 Standardabonnement
uns dementsprechend, wieder Menschen zu sehen – auch             Nuria Piller                      Fr. 15.- für ein Jahr
wenn es sich zu Beginn doch etwas komisch anfühlte. Zum          Sophie Probst                     Fr. 28.- für zwei Jahre
Glück blieben die Lockerungen bis Anfang August bestehen         Leonie Rohner                     abo@etue.ch
und wir konnten auch unser traditionelles etürli durchfüh-       Christian Schäpper
ren. Eine tolle, mehrtägige Wanderung im Glarnerland führ-       Giorgio Scherrer                  Druck
te uns unter anderem auf den Gipfel des Spitzmeilen.             Anne-Christine Schindler          Stamm Druck Schleitheim
   Trotz – oder vielleicht gerade wegen – des ungewöhnli-        Michael D. Schmid                 stamm+co. AG
chen Semesters konnten wir einen Rekordzuwachs an neu-           Antonia Schulte-Brinkmann         Hofwiesen 6
en Mitgliedern verzeichnen. Gleich elf neue, engagierte          Menoa Stauffer                    8226 Schleitheim
Schreibende fanden dieses Semester zu uns: Carmen Borto-         Elia Stucki
lin, Konstantin Bosshard, Carla Burkhard, Elena D’Amato, Si-                                       Kontakt
mon Eugster, Brian Haimoff, Jana Kierysch, Mira Imhof, Anto-     Titelblatt                        etü-Redaktion
nia Schulte-Brinkmann, Menoa Stauffer und Elia Stucki.           Rafael Koller (rafaelkoller.ch)   Karl-Schmid-Str. 4
Nach langjähriger und sehr engagierter Mitarbeit verliessen                                        8006 Zürich
uns Nadja Senn, Valentin Rubin und Livia Merz. Wir danken        Illustrationen                    redaktion@etue.ch
euch dreien herzlich für eure Zeit beim etü und hoffen, euch     Lena Kissóczy                     www.etue.ch
bald mal wieder auf ein Bier zu treffen – im Zähringer, nicht    (lenakissoczy.com)                ISSN 2235-4611
auf Zoom.                                                        Jakob Näf (jakobnaef.ch)
   Euch, liebe Leserinnen und Leser, möge der Start in den
Herbst 2020 gelingen. Wir wünschen viel Vergnügen bei der        Lektorat
Lektüre. Auf den Wandel! Auf den Umbruch!                        Camille Schneiter


etü HS 2020                                                                                                                  101

Zurück nach oben