Convolutional Neural Networks - Methoden und Anwendungen

Proseminar Convolutional Neural Networks - Methoden und Anwendungen (Bachelor)

Nummer	Umfang	Termin	Dozent
040602	2S	Proseminar	Heinrich Müller, Frank Weichert

Beschreibung

Convolutional Neural Networks (CNNs), zu Deutsch kurz „Faltungsnetze“, sind eine spezielle Ausprägung künstlicher neuronaler Netze. Künstliche neuronale Netze können als ein vom visuellen Cortex des Menschen inspiriertes Berechnungskonzept verstanden werden. Obwohl sie weit davon entfernt sind, die biologische neuronale Verarbeitung präzise zu modellieren, sind CNNs beispielsweise in der Lage, Erkennungsaufgaben wie die Unterscheidung von Bildinhalten, z.B. von „Katze“, „Maus“ und „Elefant“, mit einer Genauigkeit zu lösen, die anderen Berechnungsverfahren weitgehend überlegen ist.

CNNs setzen die Eingabe in eine spezielle interne Repräsentation um, auf deren Grundlage sie dann die gestellte Aufgabe, etwa die Klassifikation von Bildinhalten im obigen Beispiel, lösen und das Ergebnis ausgeben. In einem Anlern- oder Trainingsprozess, der auf Beispielen basiert, wird eine CNN-Struktur in die Lage versetzt, anwendungsspezifische Repräsentationen und Klassifikatoren zu realisieren. Das Lernen basiert methodisch auf einschlägigen Methoden der kontinuierlichen mathematischen Optimierung.

Eine Besonderheit von CNNs ist, dass sie die Repräsentation in eine unter Umständen tiefe Hierarchie von zunehmend abstrahierenden Repräsentationen gliedern. Diese spezielle Art des maschinellen Lernens wird auch als „Deep Learning“ bezeichnet. Häufig sind beträchtliche Mengen an Trainingsbeispielen und, damit verbunden, ein extrem hoher Berechnungsaufwand erforderlich. Die heute verfügbaren und handhabbaren großen Datenmengen einerseits und geeignete kostengünstige hochparallele Berechnungs-Hardware andererseits, haben die CNNs praktikabel gemacht. Hierbei ist insbesondere der Bereich des GPGPU(„General Purpose Graphics Processor Unit“)-Computing zu nennen, welcher Graphikkarten oder verwandte Architekturen einsetzt, die durch eine Vielzahl von parallel arbeitenden Prozessoren geprägt sind. Das Deep Learning mit CNNs zählt zu den zurzeit aktivsten Bereichen der Grundlagenforschung und der Anwendung in der Informatik.

In diesem Proseminar sollen die Struktur und Funktionsweise verschiedener Ausprägungen von CNNs präsentiert und der Einsatz von CNNs an Anwendungsbeispielen mit Schwerpunkt aus dem Visual Computing illustriert werden.

Materialien

Link zum Moodle-Raum

Teilnahmevoraussetzungen

Formale Teilnahmevoraussetzungen gibt es nicht. Hilfreiche Voraussetzungen für das Proseminar sind jedoch neben den einführenden Vorlesungen in die Programmierung die Module „Mathematik für Informatiker 2“ bzw. „Höhere Mathematik 1“ und „Wahrscheinlichkeitsrechnung und mathematische Statistik“ (WRumS) für Informatiker.

Literatur

Das Proseminar wird sich an dem Buch „Sandro Skansi: Introduction to Deep Learning, Springer International Publishing AG, 2018 (elektronisch zugänglich aus dem Universitätsnetz über die Universitätsbibliothek) orientieren, welches durch Material aus anderen Büchern oder wissenschaftlichen Artikeln ergänzt wird.

Zu erbringende Studienleistungen

Teilnahme am zentral angebotenen Präsentationskurs. Diese Studienleistung ist Voraussetzung für die Modulprüfung.
Modulprüfung: Es ist ein Vortrag von ca. 30 Minuten auf Grundlage einer zu erstellenden Präsentation (z.B. mit Powerpoint) zu halten. Ferner ist eine schriftliche Ausarbeitung zu erstellen, deren Umfang durch den Inhalt des Vortrags bestimmt ist. Der mündliche Vortrag, die Gestaltung der Präsentation sowie die schriftliche Ausarbeitung gehen jeweils zu einem Drittel in die Note der Prüfungsleistung ein.