Schwerpunkte

Machine Learning

Künstliche Intelligenz erfordert Rechenpower

12. September 2019, 08:30 Uhr   |  Armin Erich


Fortsetzung des Artikels von Teil 1 .

Definitionen und Abgrenzung der Begriffe

Bei Künstlicher Intelligenz handelt es sich generell um die Durchführung von Aufgaben mittels Strategien menschlicher Intelligenz und menschlichen Verhaltens, wie zum Beispiel das Bewerten, Schlussfolgern, lösungsorientiertes Denken und anschließende Optimierung auf Basis von positiven oder negativen Ergebnissen (sogenanntes erfahrungsbasiertes Lernen).

Machine Learning ist ein Ansatz, um Künstliche Intelligenz mittels Rechnertechnik zu implementieren. Durch den Einsatz selbstoptimierender Methoden wird erreicht, dass eine Maschine eine Aufgabenstellung mit der Zeit durch eine Feedbackschleife in Form einer Rückmeldung des Ergebnisses immer besser und schneller löst. Dabei führen mehr Daten zu besseren Ergebnissen, da es mehr zugrunde liegende Informationen für die Entscheidungsfindung gibt.

Deep Learning, Inonet
© Inonet

Oft werden die Begrifflichkeiten verwechselt. Deep Learning ist ein Teilbereich des Machine Learning, welches wiederum ein Teilbereich der künstlichen Intelligenz ist.

Deep Learning beschreibt den Ansatz, die Funktionsweise des menschlichen Gehirns mit seinen komplexen neuronalen Netzwerken rechnertechnisch nachzubilden. Deep Learning ist damit ein Teilbereich des Machine Learning, der sich zur automatisierten Lösung von Aufgaben einer neuronalen Netzwerk-Struktur bedient. Die Basis für Deep Learning ist derzeit ‚Big Data‘, also die Auswertung von riesigen Datenmengen. Eine Maschine lernt dabei innerhalb einer Trainingsphase, durch Abstraktion Eigenschaften zu bewerten und (richtige) Entscheidungen beziehungsweise Einordnungen zu treffen – etwa anhand von Bilddatenauswertung, Körperschall-Erfassung oder Sprachanalyse. Die für den Trainingsvorgang notwendigen Daten werden von Sensoren für unterschiedliche physikalische Größen erfasst.

Im Rahmen eines Lernvorganges gilt es zunächst, auf Basis sehr vieler Daten ein Modell zu generieren, welches speziell auf die Erledigung dieser Aufgabe zu trainieren ist. Um die Optimierung – sprich den Lernvorgang – durchführen zu können, muss immer eine externe Rückmeldung erfolgen. Am Ende dieses Performance-intensiven Prozesses steht ein (Software-)Modell, welches sich anschließend auf eine deutlich weniger performante Maschine zur Bearbeitung genau dieser Aufgabe übertragen lässt. Dieser Vorgang nennt sich Inferenz, die entsprechenden Geräte werden als Inferenzrechner bezeichnet.

Wie bereits erwähnt, arbeitet Deep Learning mit einer Nachbildung neuronaler Netze. Dabei sind die Neuronen in einer unterschiedlichen Anzahl einzelner Schichten (Tiefe) angeordnet, und die Neuronen einer Schicht sind jeweils mit den Neuronen der vorhergehenden und nachfolgenden Schicht vermascht. Jedes Neuron führt mathematisch gesehen mehrere Operationen durch: Jeder Eingang x wird mit einem Gewichtungswert y multipliziert, ein Offsetwert n wird addiert und dann kumuliert an das nachfolgende Neuron weitergegeben. Handelt es sich bei den Input-Werten um eine Matrix statt um einen Vektor, so spricht man von einem ‚gefalteten neuronalen Netzwerk‘ (engl. Convolutional Neural Network). Mathematisch gesehen handelt es ich hierbei um sogenannte ‚Multiply-Accumulate‘-Operationen (Multiplikation zweier Werte mit anschließender Addition eines weiteren Wertes) sowie Matrizen-Multiplikationen, die ebenfalls aus einer großen Zahl von Multiplikationen zweier Werte mit anschließender Aufaddierung bestehen. Für diese Operationen ist extrem viel Rechenleistung nötig, die in Form unterschiedlicher Spezialhardware bereitgestellt werden kann (Coprozessor-Konzept).

Um den Unterschied von Training und Inferenz zu verdeutlichen: Im Rahmen der Trainingsphase werden für alle ‚Neuronen‘ und deren Verbindungen die genannten Parameter y und n solange auf Basis der jeweiligen Ergebnisse verändert (optimiert), bis das Netzwerk die Aufgabenstellung mit einer vorher festgelegten Treffsicherheit richtig durchführt. Am Ende ist die Optimierung des Netzwerkes im Hinblick auf die jeweilige Aufgabenstellung abgeschlossen, also alle x- und n-Werte sind festgelegt, sodass das Modell anschließend auf einen Inferenzrechner transferierbar ist. Auf letzterem findet dann kein weiterer Lernvorgang statt.
 

Seite 2 von 4

1. Künstliche Intelligenz erfordert Rechenpower
2. Definitionen und Abgrenzung der Begriffe
3. Spezialhardware für Trainingsvorgänge und Inferenzen?
4. Vor Ort oder in der Cloud?

Auf Facebook teilenAuf Twitter teilenAuf Linkedin teilenVia Mail teilen

Verwandte Artikel

InoNet Computer GmbH