Digitalisierung bedeutet: Wir leben in einer datenreichen Zeit. Es gibt Daten wie Sand am Meer. So sind auch die Dimensionen digitaler Textdaten im Sinne von „Big Data“ überwältigend. Um aber die Materialflut bewältigen und ordnen zu können, sind neue digitale Wege zu gehen. In dieser Veranstaltung werden wir daher Verfahren des „Text Mining“ nutzen, um große Textdaten-Sammlungen (d.h. Korpora) effizient mit Algorithmen zu analysieren.

Die Tore in die Welt der maschinellen Textverarbeitung öffnen sich allerdings erst, wenn man in der Lage ist, analytische Ideen in Programm-Code zu gießen. Daten sind das neue Öl? Man muss programmieren können, um aus dem neuen wertvollen Rohstoff "Daten" etwas herausholen zu können.

Daher verbindet dieser Kurs eine Einführung in das wissenschaftliche Programmieren - konkret in die Statistiksprache „R“ - mit einer anwendungsorientierten Einführung in Verfahren des Text Mining. Dabei können wir auf die Daten und Analyse-Tools des PolMine-Projekts (polmine.de) zurückgreifen. Mit dem Korpus aller Debatten im Deutschen Bundestag („GermaParl“) und den UCSSR-Online-Foliensätze (für „Using Corpora in Social Science Research“) stehen Ihnen Ressourcen zur Verfügung, mit denen Sie schnell relevante politikwissenschaftliche Erkenntnisse erzielen können.

Als Voraussetzung müssen Sie keinerlei Programmierkenntnisse mitbringen - nur Offenheit und etwas Leidensfähigkeit, Code mit geschweiften und eckigen Klammern zu schreiben. Indem Sie am Ende des Kurses über "data literacy" und Grundlagen des Programmierens verfügen, werden Sie die Welt der Digitalisierung besser verstehen. Die Abgeschiedenheit, welche die Corona-Krise erzwingt, können Sie als beste Gelegenheit nutzen, dieses Wagnis einzugehen!