CTRL + F
Eine Suchmaschine für die Quellenarbeit bauen
Machine-readable full text and bibliographic details for the 2020 etü article.
Diese Seite bietet die kanonische DOI, eine maschinenlesbare Volltextversion für bessere Auffindbarkeit.
Zitierangaben
- Autor: Moritz Mähr
- Titel: CTRL + F: Eine Suchmaschine für die Quellenarbeit bauen
- Zeitschrift: etü, Heft II, 2020, S. 88-91
- DOI: https://doi.org/10.3929/ethz-b-000449830
Downloads
- Publisher page: https://www.research-collection.ethz.ch/handle/20.500.11850/449830
- Maschinenlesbarer Volltext (TXT): ctrl-f-eine-suchmaschine-fuer-die-quellenarbeit-bauen.txt
Volltext (maschinell extrahiert)
Der folgende Volltext wurde aus der PDF-Version extrahiert, um die Indexierung in Suchmaschinen und KI-gestützten Systemen zu verbessern. Für Zitierungen gilt weiterhin die Verlagsfassung unter der DOI.
ETH Library
CTRL + F. Eine Suchmaschine für
die Quellenarbeit bauen
Journal Article
Author(s):
Mähr, Moritz
Publication date:
2020-09
Permanent link:
https://doi.org/https://doi.org/10.3929/ethz-b-000449830
Rights / license:
In Copyright - Non-Commercial Use Permitted
Originally published in:
Etü 2020(2)
This page was generated automatically upon download from the ETH Zurich Research Collection.
For more information, please consult the Terms of use.
Historiker*innen - Zeitschrift
Elfenbeintürmer / Historisches Seminar /
Universität Zürich / Herbstsemester 2020
«Wir haben gehofft, dass uns keiner verrät»
Eine polnische Familie erzählt von der Wende
Urlaubsparadies für US-Soldaten
Die Schweiz im Umbruchsjahr 1945
#ChileDespertó
Reportage aus einem Land in Aufruhr
UMBRUCH
«WIR ERZÄHLEN STUDIERENDEN DINGE, AN DIE WIR LÄNGST NICHT MEHR GLAUBEN» 06
Ein Gespräch über das Denken in Umbrüchen mit Brigitta Bernet, Claudia Opitz-Belakhal und Anja Rathmann-Lutz
COMPUTERLIEBE: DEKONSTRUKTION EINES UMBRUCHNARRATIVS 12
Von Anne-Christine Schindler
ÜBER UMWEGE AUS DEM KOMMUNISMUS: ERINNERUNGEN EINER POLNISCHEN FAMILIE 15
Von Jana Kierysch
EINSAME GALAXIE, SINNHAFTE LINIE: WIE SICH DIE GRENZEN VON LEBEN UND TOD VERSCHIEBEN 18
Von Sophia Bosshard und Mira Imhof
TOO MUCH INFORMATION! JOURNALISMUS IM INTERNETZEITALTER 25
Von Elena D’Amato
VOM STEIGBÜGEL ZUM SEGWAY 28
Die etü-Redaktion über Dinge, die die Welt revolutionierten – oder auch nicht
ANNE BOLEYN: EINE GESCHICHTE ÜBER MYTHEN, TOD UND TV-SERIEN 32
Von Antonia Schulte-Brinkmann
SIGMUND FREUD: DIE DRITTE KRÄNKUNG DER MENSCHHEIT? 36
Kommentar von Carla Burkhard
DER AKKORD FÜR EIN ENDENDES JAHRHUNDERT: WAGNERS PLATZ IN DER MUSIKGESCHICHTE 38
Von Konstantin Bosshard
DER «BACILLENTÖDTER»: ÜBER RASSISTISCHE METAPHERN IN DER BAKTERIOLOGIE 40
Von Elia Stucki
«SCHRECK VON DRÜBEN»: SPRECHEN ÜBER AIDS UND SEINE FOLGEN 42
Von Julia Vetter
GEFANGEN IN FRANÇAFRIQUE: KONTINUITÄTEN IM KOLONIALEN ERBE 45
Von Kai Kersten
DAS LETZTE GEFECHT DER HONGKONGER MILLENNIALS: PERSPEKTIVEN AUS DER DIASPORA 48
Von Manuel Kissóczy
VON RÖHRLIJEANS UND BRUTKÄSTEN 52
Umbrüche im Leben der etü-Redaktion
ALS DER FILM ZU SPRECHEN BEGANN: EINE ZÄHE ERFOLGSSTORY 57
Von Simon Eugster
4 etü HS 2020
#CHILEDESPERTÓ: REPORTAGE AUS EINEM LAND IN AUFRUHR 60
Von Nuria Piller
KÄMPFE, WO DU STEHST! REVOLUTIONSTHEORIEN MIT (POST)KOLONIALEM VORDERGRUND 64
Von Helena Dobiess und Kai Kersten
GEISTREICH: WIE DER DEUTSCHE IDEALISMUS UNSER DENKEN VERÄNDERT HAT 68
Von Michael D. Schmid
«DIE HARMLOSE INVASION»: YANKEES EROBERN DIE SCHWEIZ 72
Von Menoa Stauffer
IM KRIEG GEBOREN: DIE ERSTE AKTIENGESELLSCHAFT DER WELT 75
Von Sven Bonnard
SOLLEN SIE FALLEN? EINE AUSEINANDERSETZUNG MIT CECIL RHODES 78
Kommentar von Giorgio Scherrer
HISTORIKER IM BERUF
«IN JEDEM VON UNS STECKT EIN BRUNO MANSER» 80
Interview mit Lukas Straumann von Antonia Schulte-Brinkmann und Carla Burkhard
FORSCHUNG
CARE-ARBEIT AM FÜRSTENHOF? EINE SPURENSUCHE NACH DEM FRAUEN*STREIK 85
Von Livia Merz
CTRL + F: EINE SUCHMASCHINE FÜR DIE QUELLENARBEIT BAUEN 88
Von Moritz Mähr
HISTORISCHES SEMINAR
EIN JAHR ZEITGESCHICHTE: STUDIS ZIEHEN BILANZ 92
Von Giorgio Scherrer
ALUMNI 96
KLASSIKER DER GESCHICHTSSCHREIBUNG
VERZERRUNG UND VERSCHWÖRUNG: GESCHICHTE DER HOLOCAUSTLEUGNUNG 98
Von Konstantin Bosshard
REZENSION
WAS TUN MIT SCHMUTZIGEM GELD? VOM SCHWEIZER UMGANG MIT POTENTATENGELDERN 100
Von Christian Schäpper
IMPRESSUM 101
MENSCHEN AM HS
«DIE ÄRA METZGER» 102
Die Bibliothekarin Barbara Metzger, aufgezeichnet von Giorgio Scherrer
etü HS 2020 5
FORSCHUNG
CTRL+F: EINE SUCHMASCHINE FÜR
DIE QUELLENARBEIT BAUEN
Vor vier Jahren hat die Professur für Technikgeschichte an der ETH Zürich mit der Entwick-
lung einer Suchmaschine für Quellen aus dem Schweizerischen Bundesarchiv begonnen.
Was gilt es dabei zu bedenken? Und wie verändert eine solche Maschine Forschungsprakti-
ken? Ein Bericht über technische, organisatorische und fachliche Herausforderungen.
Von Moritz Mähr
Wenn Quellenarbeit und Suchmaschine im selben Satz er- che, sondern auch Suchtreffer an die Höchstbietenden. Wie
wähnt werden, macht sich schnell Skepsis breit. Was haben die Suchtreffer zustande kommen, legt Google nicht offen.
der Gang ins Archiv, die Konsultation der Findmittel, die Welche Seiten indiziert werden, welche als relevant gelten
Transliteration, das Close Reading, die Kritik oder die Ausle- und welche Google ignoriert, ist nicht ersichtlich. Dazu
gung einer Quelle mit einer kinderleicht zu bedienenden Ma- kommt, dass basierend auf dem Persönlichkeitsprofil, das
schine zu tun? Oft nicht viel. Das lernen die meisten Student- Google über jede Benutzer*in angelegt hat, die Suchresultate
*innen spätestens mit der ersten ausschliesslich auf Google variieren. Solche Suchresultate kann man weder reproduzie-
Search basierenden Semesterarbeit, die dem Rotstift der Be- ren noch nachvollziehen. Sie sind für die wissenschaftliche
treuer*in zum Opfer gefallen ist und nochmals geschrieben Arbeit ungeeignet.
werden muss. Einer gewissenhaften Historiker*in ist klar, dass Ein ganz anderes Bild zeigt sich, wenn man die physischen
die Abfrage einer Suchmaschine nur ein erster Schritt einer Anlaufstellen recherchierender Historiker*innen – Archive, Bi-
Recherche sein kann. Danach muss man die Ergebnisse der bliotheken, Sammlungen etc. – in den Blick nimmt. Die oft-
Abfrage einordnen, kritisch hinterfragen und mit der Fachlite- mals öffentlich finanzierten Gedächtnisinstitutionen und ihre
ratur (aus einer Bibliothek) und Quellen (aus einem Archiv) Dienstleistungen stehen Google diametral gegenüber. Sie
abgleichen. Sich blind auf eine Suchmaschine zu verlassen, ist verfügen über einen klaren Auftrag und geregelte Prozedu-
unwissenschaftlich. ren. Reproduzierbare und nachvollziehbare «Suchergebnis-
se» gehören genauso zu ihren Kernaufgaben wie die Pflege
Google ist kein wissenschaftliches Werkzeug und Erweiterung des Bestandes. Sie sind oft so organisiert,
Dass viele Historiker*innen zuerst einmal irritiert sind, wenn dass die Signatur nicht nur den Standort der Archivale, son-
man in Bezug auf ihr Fach von Suchmaschinen spricht, liegt dern auch etwas über den Entstehungszusammenhang des
unter anderem daran, dass uns bei diesem Wort nicht profes- Archivguts preisgibt. Die Archivar*innen des Bundesarchivs
sionelle historische Findmittel wie der Bibliothekskatalog Bern entnehmen der Signatur E4268-06#2007/112#22*, dass
swissbib.ch oder die Archivplattform archives-online.org vor es sich um ein Dossier (*) aus dem Teilbestand des Bundes-
dem geistigen Auge erscheinen, sondern Google. Google amts für Polizei (4268-06) handelt. Der Teilbestand wiederum
lässt viele Eigenschaften eines seriösen, wissenschaftlichen gehört zum Bestand des Bundesstaats seit 1848 (E). Die Find-
Werkzeugs vermissen: Google verkauft nicht nur Anzeigeflä- mittel des Archivs sind keine Suchmaschinen, die unstruktu-
88 etü HS 2020
FORSCHUNG
rierte Inhalte des Archivguts aufbereiten, sondern Wissens- meln. Dazu müssen die Eingabedaten – die Text- und Zei-
speicher einer Ordnungsleistung des Archivs. chenerkennung der Dokumente (OCR) – von hoher Qualität
sein. Die Texterkennung scheitert jedoch in vielen Dokumen-
Digitalisierung macht auch vor dem Bundesarchiv nicht Halt ten an der Materialität der Quellen. Mehrsprachige Doku-
Mit den sich wandelnden Medienkonsumgewohnheiten der mente, Helvetismen, vergilbtes Papier, ungewöhnliche
Benutzer*innen und den sinkenden Kosten für Speicherplatz Schreibmaschinentypen und handschriftliche Notizen er-
und Breitbandanschlüsse verändern sich auch die Archive schwerten die OCR-Texterkennung.
und ihre Findmittel. So bietet beispielsweise das Bundesar-
chiv seit Ende 2019 zentrale Dienstleistungen online an: Ar- Angaben zum Autor
chivalien können über eine Website bestellt werden und Di- Moritz Mähr ist wissenschaftlicher Mitarbeiter an der Pro-
gitalisate stehen «on-demand» nach einigen Sekunden oder fessur für Technikgeschichte der ETH Zürich und am
– falls sie noch digitalisiert werden müssen – nach einigen Ta- Collegium Helveticum. Er studierte Wissensgeschichte
gen zum kostenlosen Download bereit. Momentan ist erst ein und -philosophie, Informatik und Banking & Finance in
Bruchteil des riesigen Archivs online verfügbar, bis Ende der Zürich und Berlin. Zurzeit arbeitet er an einer Dissertation
2020er Jahre sollen jedoch sämtliche Dossiers online konsul- zur Digitalisierung der Migrationsbehörden in der
tiert werden können. Schweiz, die Teil des vom SNF finanzierten Projekts «Aus-
Als David Gugerli, Professor für Technikgeschichte an der handlungszonen» ist. Seine Forschungsinteressen umfas-
ETH Zürich, 2015 mit dem Bundesarchiv eine Forschungsko- sen Computergeschichte, Migrations Studies und Digital
operation einging und mehrere Dutzend Dossiers von meh- History.
reren Hundert Seiten bestellte, war die Digitalisierung von Ar-
chivgut nicht nur mit viel kostspieliger Handarbeit, sondern Die Ergebnisse des Topic Modellings waren für die am Pro-
auch mit logistischen Herausforderungen verbunden. Über jekt beteiligten Historiker*innen deshalb in den meisten Fäl-
90 Gigabytes an PDF-Dateien mussten auf USB-Sticks gespei- len nicht sehr aufschlussreich. Um trotzdem mit den Quellen
chert und per Einschreiben verschickt werden. In Zürich an- arbeiten zu können, griffen sie auf bewährte Strategien zu-
gekommen drängte sich die Frage auf, wie sich eine Handvoll rück: Sie sortierten die Dateien und Ordner nach den Äm-
Historiker*innen in vernünftiger Zeit einen Überblick über 90 tern, aus denen sie stammten, und versahen sie mit den An-
Gigabyte Akten verschaffen könnten. gaben über den Entstehungskontext (wie Entstehungszeit
und Dossiertitel) aus dem Archivplan. So war bereits vor dem
Die Maschine scheitert an widerspenstigen Quellen Öffnen der Datei ersichtlich, von wem und aus welcher Zeit
Zusammen mit den ETH Scientific IT Services (SIS) suchte man eine Quelle stammte. Auf dieser Basis wurde eine Datenbank
nach Lösungen, um die Datenmenge zu bewältigen. Für eine angelegt, in der die in den Quellen enthaltenen Texte ge-
erste Analyse sollten die in den Quellen enthaltenen Schrift- speichert und die häufigsten Fehler der Texterkennung be-
zeichen eingelesen und die Dokumente in verschiedene the- reinigt wurden. Mit der Volltextsuche der Dokument-Daten-
matische Cluster aufgeteilt werden. Dafür wurde Topic Mo- bank stiess man nun auch in Dossiers, die sich über mehrere
delling eingesetzt, eine verbreitete Methode zur Dutzend PDF-Dateien erstreckten, schnell auf interessante
maschinellen Textanalyse. In einem ersten Schritt schätzten Textstellen. Bei der Textstelle angekommen, konnte man
die Informatiker*innen die Anzahl der vermuteten themati- wieder auf bewährte Methoden der historischen Quellenar-
schen Cluster ab, dann berechnete der Algorithmus für jedes beit wie das Close Reading zurückgreifen.
Dokument die Wahrscheinlichkeit, zu einem oder mehreren
Clustern zu gehören. Bestenfalls generiert der Algorithmus Wie kommt das Wissen aus dem Archiv in die Suchmaschine?
für jeden thematischen Cluster eine Liste von Wörtern, die für Die Volltextsuche der Dokument-Datenbank hatte aber auch
menschliche Betrachter*innen intuitiv Sinn ergeben: Versi- ihre Tücken. Der Archivkontext – also welches Dossier vor
cherung, Renten, Sicherheit, System, Abkommen, Arbeitneh- oder nach dem gefundenen Dossier im Bestand war – ging
mer etc. Im schlechtesten Fall gruppiert der Algorithmus genau so verloren wie die Einheit des Dossiers selbst, das
Wörter, die eine ähnliche Verteilung über die Dokumente auf- über mehrere PDF-Dateien verteilt keinen immanenten Zu-
weisen, aber keinen Aufschluss über die Bedeutung des Clus- sammenhang mehr zu haben schien. Dass die Texterken-
ters geben: der, hier, dort, das etc. nung aus einem «w» ein «vi» machte oder Briefköpfe gänzlich
Hinter den Wortlisten steckt eine nicht unproblematische ignorierte, erschwerte die Arbeit zusätzlich.
Annahme aus der Wortsemantik: Wörter sind die zentralen Um brauchbare Ergebnisse zu liefern, musste eine andere
Bedeutungsträger und Wörter mit einer ähnlichen statisti- Suchmaschine her. Sie sollte mit einer schlechten Texterken-
schen Verteilung haben eine ähnliche Bedeutung. Bei perfekt nungsrate umgehen und den Inhalt sowie die Metadaten – das
transkribierten und ausreichend homogenen Texten liefert Wissen über die Quellen aus dem Archiv – sinnvoll verbinden
die Methode Cluster, die Dokumente mit ähnlichem Inhalt können. Zudem sollte sie an Erkenntnispraktiken anschliessen,
oder ähnlichen Strukturmerkmalen (Textsorten etc.) versam- die den Historiker*innen vertraut waren. Die Wahl fiel 2018
etü HS 2020 89
FORSCHUNG
Die Suchmaschine Open Semantic Search (OSS) macht das Leben einfacher. Schneller bei der gesuchten Quelle zu sein ist praktisch, macht aber die auf-
wendige Quellenarbeit nicht hinfällig.
auf Open Semantic Search (OSS). OSS ist eine freie Software, gung des Einsichtsgesuchs aufgeführt waren. Es musste ge-
entwickelt vom Berliner Investigativjournalisten Markus währleistet sein, dass die Software auch dann stabil war, wenn
Mandalka und ausgerichtet auf die Bedürfnisse seines Meti- das ganze Team gleichzeitig damit arbeitete. Und nicht zuletzt
ers. Damit die Historiker*innen damit arbeiten konnten, mussten Suchverlauf und -ergebnisse – also einzelne PDF-Da-
mussten verschiedene Anpassungen vorgenommen werden: teien – gespeichert und wieder aufgerufen werden können.
Die automatische Texterkennung musste so eingestellt wer-
den, dass möglichst viele Mängel der historischen Quellen Die bessere Maschine: die Professur
bereits beim Einlesen der Datei ausgemerzt werden konnten. Wichtiger als die technischen Anpassungen der Software
Für jede Quelle wurden die korrespondierenden digitalen war, dass die Maschine an die Arbeitsabläufe der Historiker-
Metadaten aus dem Bundesarchiv geladen und in einem ge- *innen angepasst werden konnte. Dieser Arbeitsablauf
meinsamen Datensatz abgelegt – das erlaubt es bei Suchan- sieht in meinem Fall folgendermassen aus: Ausgehend von
fragen, die Logik des Archivplans mit der Volltextsuche zu einer Forschungsfrage grenze ich den Quellenbestand ein.
kombinieren. Darüber hinaus sollte die Suchmaschine das Ich tue das, indem ich nach bestimmten Begriffen suche,
Entstehungsdatum zu ermitteln versuchen, indem die erste mir einige Quellen anschaue und anschliessend die Such-
Datumsangabe aus dem Text ausgelesen wurde. Denn die abfrage weiter eingrenze. Sobald ich interessante Quellen
Metadaten aus dem Bundesarchiv geben lediglich eine Zeit- finde, erstelle ich Arbeitskopien oder Abschriften. Das er-
spanne an, in der das Dokument entstanden ist. Wenn sich laubt nicht nur das Verschlagworten und Exzerpieren, son-
dieser Zeitraum von 1953 bis 1988 erstreckt, ist es äusserst dern auch die Katalogisierung in ein eigenes, der For-
praktisch zu wissen, dass diese konkrete Quelle aus dem Jahr schungsfrage angepasstes Ordnungssystem. (Was darüber
1972 stammt. hinaus den Vorteil hat, dass die Quellen auch dann verfüg-
Um die OSS-Suchmaschine wissenschaftlich nutzen zu kön- bar sind, wenn Internet, VPN oder Suchmaschine gerade
nen, reichten verbesserte Suchergebnisse aber nicht aus. Es den Dienst quittieren.) Wenn ich genug Material zusam-
musste sichergestellt werden, dass nur diejenigen Personen mengetragen habe, beginne ich die Puzzlestücke zusam-
auf die Dokumente zugreifen konnten, die in der Genehmi- menzufügen.
90 etü HS 2020
FORSCHUNG
Klar: Dieses Vorgehen macht nur Sinn, wenn es meinen Ar- griffen und Filtereinstellungen einschränken und herunterladen.
beitsablauf beschleunigt oder bequemer macht. Die OSS- An diesem Punkt steht die OSS-Suchmaschine heute. Das Korpus
Suchmaschine muss schnell sein und interessantere Treffer – eine zentrale Eingangsvariable des Algorithmus – wird nun
generieren als die Suche auf meinem Mac. Dank eines Konfi- durch das Wissen und die Forschungsintuitionen der Wissen-
gurationsfehlers tat sie das auch. Anstatt sich auf den Quel- schaftler*innen vorstrukturiert und kontextualisiert. Die Rohtex-
lenordner zu beschränken, durchsuchte sie das gesamte te kann man anschliessend in die Topic Modelling-Software
Netzlaufwerk der Professur. So tauchten neben den Quellen DARIAH-DE TopicsExplorer einspielen. Die intuitive Oberfläche
auch Sekundärliteratur, Forschungs- und Lehrunterlagen dieser Open Source-Software führt interaktiv durch die einzel-
der vergangenen zwei Jahrzehnte in den Suchresultaten nen Arbeitsschritte und erlaubt es auch technisch weniger ver-
auf. Plötzlich wurde sichtbar, wer an ähnlichen Themen ar- sierten Benutzer*innen, in kurzer Zeit Experimente mit Topic Mo-
beitet(e) und welcher Sekundärtext oder welches Archiv delling durchzuführen.
hilfreich sein könnten. Ein wichtiger Teil des organisationa-
len Wissensspeichers – Quellentranskripte und Forschungs- Awesome Digital History-Fundus
protokolle von Kolleg*innen – waren damit allen Mitarbeiter-
Als Verfechter von Open Access und
*innen zugänglich.
Open Source kuratiert Moritz Mähr
Angeschlossen an das gesamte Netzlaufwerk der Profes-
eine Liste mit den besten öffentlich zu-
sur erlaubte die OSS-Suchmaschine nicht nur einfache Su-
gänglichen Tools, Quellensammlun-
chen und komplexe Nachforschungen nach bestimmten Be-
gen und Plattformen.
griffen, sondern auch ein Stöbern im organisationalen
Wissensspeicher. Wie in einem Bibliothekskatalog liess sich
das gesamte Netzlaufwerk filtern nach Projekten, Lehrver- Technische Fragen und inhaltliche Verschiebungen können so
anstaltungen, dem Enstehungszeitraum, der Sprache etc. aufeinander bezogen und der Grundstein für die historische
Der neue Arbeitsmodus legte Querverbindungen zwischen Operationalisierung des Topic Modellings gelegt werden: Wie
Quellen aus dem Bundesarchiv, Sekundärliteratur, For- sehen die thematischen Cluster aus, wenn ich nach 15, 30 oder
schungs- und Lehrunterlagen offen und half die Menge an 50 Clustern suche? Wie verändert sich die Zusammensetzung
interessanten Dokumenten deutlich einzuschränken. der einzelnen Cluster, wenn die Quellen aus einem gewissen De-
Aber selbst wenn man die Suche auf einige archivierte partement oder aus einer gewissen Zeitspanne aus dem Korpus
Projekte und damit auf einige Promille des Gesamtbestan- entfernt werden? Kann die Software dabei helfen, die für meine
des einschränkte, kamen schnell über 1’000 Dokumente zu- Forschungsfrage relevanten Dokumente zu identifizieren?
sammen. Aufgrund dieser unüberschaubaren Textmenge Topic Modelling-Experimente mit den umfangreichen Be-
rückte die maschinelle Textanalyse wieder in den Fokus: ständen aus dem Bundesarchiv laufen und fordern den For-
Könnte sie dabei helfen, diese synthetisch zusammenge- scher*innen viel Lernbereitschaft und Geduld ab. Ob sich die
stellte Auswahl an heterogenen Dokumenten vorzusortie- Methode etablieren wird, hängt nicht nur davon ab, ob und wie
ren und weiter einzuschränken? man ihre Ergebnisse für die geschichtswissenschaftliche For-
schung einsetzen kann. Vielmehr wird sich zeigen müssen, ob
Von der Suchmaschine zurück zum Experimentalsystem und wie das Topic Modelling an bereits bekannte Erkenntni-
Für die eingangs erwähnte maschinelle Textanalyse mittels To- spraktiken anschliessen kann. Die Erfahrungen im Aufbau mit
pic Modelling wurde das gesamte Quellenkorpus aus dem Bun- der OSS-Suchmaschine haben nämlich gezeigt, dass die digita-
desarchiv eingespielt und in 50 thematische Cluster aufgeteilt. len Werkzeuge nur dann sinnvoll genutzt werden, wenn sie sich
Dabei wurden die Auswertungen zunächst zentralisiert von der auf das Wissen und das Können der Benutzer*innen beziehen.
SIS vorgenommen und in Form von Ergebnistabellen an die For-
scher*innen weitergegeben. Aber diese statischen Artefakte
wurden dem experimentellen Charakter des Topic Modelling
nicht gerecht. Denn bereits kleine Veränderungen am Korpus
oder an der Anzahl der vermuteten thematischen Cluster kön- Literatur
nen grosse Auswirkungen auf die «Sortierleistung» des Algorith- • Haber, Peter: «Google-Syndrom». Phantasmagorien des
mus haben. Um den Forscher*innen ein Werkzeug an die Hand historischen Allwissens im World Wide Web, in: Kilcher,
zu geben, das sich auch für historische Fragestellungen operati- Andreas B. / Gugerli, David / Hirschi, Caspar u. a. (Hg.): Di-
onalisieren lässt, mussten sie selbst Experimente mit den Daten gital humanities, Zürich 2013 (Nach Feierabend 9.2013),
durchführen können. S. 175–189.
Damit die Historiker*innen sich mit den Topic Modelling-Expe- • Milligan, Ian: History in the age of abundance? How the
rimenten vertraut machen konnten, wurden mehrere Work- Web is Transforming Historical Research, Montreal 2019.
shops mit der SIS und der Professur für Technikgeschichte durch- • Putnam, Lara: The Transnational and the Text-Searchable.
geführt. Auch die OSS-Suchmaschine wurde angepasst: Nun Digitized Sources and the Shadows They Cast, in: The
lässt sich das Korpus für die maschinelle Textanalyse mit Suchbe- American Historical Review 121:2, 01.04.2016, S. 377–402.
etü HS 2020 91
IMPRESSUM
EIN SEMESTER IM UMBRUCH
Von Manuel Kissóczy
Was für ein Semester. Innerhalb von wenigen Wochen hatte Redaktion Erscheinungsdatum
sich unser Leben grundlegend verändert. Die Stimme unse- Carmen Bortolin Herbstsemester 2020
rer Dozierenden ertönte nun, verzerrt durch die Tücken der Sven Bonnard
Videotelefonie, aus den Speakern unserer Laptops. Grup- Carla Burkhard Auflage
penarbeiten wurden über Microsoft Teams koordiniert. Aus Konstantin Bosshard 1200 Exemplare
gemütlichen Bier-Abenden im bqm wurden virtuelle Treffen Sophia Bosshard
auf Zoom, kreative Hintergrundbilder ein Muss. Auch dieses Elena D’Amato Preis
Heft nahm selbstverständlich seinen Anfang in mehrstündi- Helena Dobiess Einzelpreis: Fr. 5.-
gen Zoom-Sitzungen. Die sich dauernd verändernden Um- Simon Eugster Einzelversand: Fr. 10.-
stände beeinflussten schlussendlich neben einem Corona- Brian Haimoff
Tagebuch auf unserer Website auch die Wahl des Heftthe- Mira Imhof Gönnerabonnement
mas. Kai Kersten Fr. 20.- für ein Jahr
Nach den ersten Lockerungen trafen wir uns im Juli für Jana Kierysch Fr. 35.- für zwei Jahre
eine «Grillete» an der Limmat. Für die meisten von uns war Manuel Kissóczy
es das erste grössere Treffen seit Mitte März, und wir freuten Sebastian Leitner Standardabonnement
uns dementsprechend, wieder Menschen zu sehen – auch Nuria Piller Fr. 15.- für ein Jahr
wenn es sich zu Beginn doch etwas komisch anfühlte. Zum Sophie Probst Fr. 28.- für zwei Jahre
Glück blieben die Lockerungen bis Anfang August bestehen Leonie Rohner abo@etue.ch
und wir konnten auch unser traditionelles etürli durchfüh- Christian Schäpper
ren. Eine tolle, mehrtägige Wanderung im Glarnerland führ- Giorgio Scherrer Druck
te uns unter anderem auf den Gipfel des Spitzmeilen. Anne-Christine Schindler Stamm Druck Schleitheim
Trotz – oder vielleicht gerade wegen – des ungewöhnli- Michael D. Schmid stamm+co. AG
chen Semesters konnten wir einen Rekordzuwachs an neu- Antonia Schulte-Brinkmann Hofwiesen 6
en Mitgliedern verzeichnen. Gleich elf neue, engagierte Menoa Stauffer 8226 Schleitheim
Schreibende fanden dieses Semester zu uns: Carmen Borto- Elia Stucki
lin, Konstantin Bosshard, Carla Burkhard, Elena D’Amato, Si- Kontakt
mon Eugster, Brian Haimoff, Jana Kierysch, Mira Imhof, Anto- Titelblatt etü-Redaktion
nia Schulte-Brinkmann, Menoa Stauffer und Elia Stucki. Rafael Koller (rafaelkoller.ch) Karl-Schmid-Str. 4
Nach langjähriger und sehr engagierter Mitarbeit verliessen 8006 Zürich
uns Nadja Senn, Valentin Rubin und Livia Merz. Wir danken Illustrationen redaktion@etue.ch
euch dreien herzlich für eure Zeit beim etü und hoffen, euch Lena Kissóczy www.etue.ch
bald mal wieder auf ein Bier zu treffen – im Zähringer, nicht (lenakissoczy.com) ISSN 2235-4611
auf Zoom. Jakob Näf (jakobnaef.ch)
Euch, liebe Leserinnen und Leser, möge der Start in den
Herbst 2020 gelingen. Wir wünschen viel Vergnügen bei der Lektorat
Lektüre. Auf den Wandel! Auf den Umbruch! Camille Schneiter
etü HS 2020 101