Digitalisierung bedeutet: Wir leben in einer datenreichen Zeit. Es gibt
Daten wie Sand am Meer. So sind auch die Dimensionen digitaler Textdaten
im Sinne von „Big Data“ überwältigend. Um aber die Materialflut
bewältigen und ordnen zu können, sind neue digitale Wege zu gehen. In
dieser Veranstaltung werden wir daher Verfahren des „Text Mining“
nutzen, um große Textdaten-Sammlungen (d.h. Korpora) effizient mit
Algorithmen zu analysieren.
Die Tore in die Welt der maschinellen
Textverarbeitung öffnen sich allerdings erst, wenn man in der Lage ist,
analytische Ideen in Programm-Code zu gießen. Daten sind das neue Öl?
Man muss programmieren können, um aus dem neuen wertvollen Rohstoff
"Daten" etwas herausholen zu können.
Daher verbindet dieser Kurs
eine Einführung in das wissenschaftliche Programmieren - konkret in die
Statistiksprache „R“ - mit einer anwendungsorientierten Einführung in
Verfahren des Text Mining. Dabei können wir auf die Daten und
Analyse-Tools des PolMine-Projekts (polmine.de) zurückgreifen. Mit dem
Korpus aller Debatten im Deutschen Bundestag („GermaParl“) und den
UCSSR-Online-Foliensätze (für „Using Corpora in Social Science
Research“) stehen Ihnen Ressourcen zur Verfügung, mit denen Sie schnell
relevante politikwissenschaftliche Erkenntnisse erzielen können.
Als
Voraussetzung müssen Sie keinerlei Programmierkenntnisse mitbringen -
nur Offenheit und etwas Leidensfähigkeit, Code mit geschweiften und
eckigen Klammern zu schreiben. Indem Sie am Ende des Kurses über "data
literacy" und Grundlagen des Programmierens verfügen, werden Sie die
Welt der Digitalisierung besser verstehen. Die Abgeschiedenheit, welche
die Corona-Krise erzwingt, können Sie als beste Gelegenheit nutzen,
dieses Wagnis einzugehen!
- Lehrende(r): Andreas Blätte
- Lehrende(r): Thomas Herrmann
- Lehrende(r): Christoph Leonhardt
- Lehrende(r): Julia Rakers