Deep Learning ist eine spezialisierte Form des Machine Learning, mit dem Computer die Fähigkeit erwerben, aus Beispielen zu lernen. Anders als beim »klassischen« Machine Learning, wo erst aussagekräftige Merkmale oder Features aus den Daten gewonnen werden müssen, erlernt beim Deep Learning ein Computermodell die Durchführung von Klassifikationsaufgaben direkt aus den unstrukturierten Rohdaten wie Bildern, Text oder akustischen Daten.
Deep-Learning-Methoden nutzen neuronale Netzarchitekturen mit vielen Ebenen. Deshalb werden Deep-Learning-Modelle häufig als tiefe neuronale Netze bezeichnet. Der Begriff »tief« bezieht sich auf die Anzahl verborgener Schichten des neuronalen Netzes, tiefe Netze enthalten bis zu 150 verborgene Schichten.
Deep-Learning-Modelle benötigen für das Training sehr umfangreiche, gekennzeichnete Datensätze, zum Beispiel Millionen von Bildern für die Bilderkennung, und lernen die Erkennung von Merkmalen direkt aus den Daten, ohne dass eine manuelle Merkmalsextraktion erforderlich ist. Je mehr Trainingsdatensätze zur Verfügung stehen, desto höher ist die Erkennungsgenauigkeit. Deep Learning erfordert zudem sehr viel Rechenleistung, für deren Bereitstellung häufig Hochleistungs-GPUs zum Einsatz kommen.
Aufgrund dieser Anforderungen wird es erst seit kurzer Zeit in der Praxis eingesetzt, obwohl die Theorie des Deep Learning bereits in den 1980er-Jahren begründet wurde. Die Erkennungsgenauigkeit von Deep Learning Algorithmen übertrifft inzwischen die von Menschen in einigen Anwendungsfeldern, zum Beispiel bei der Klassifikation von Objekten auf Bildern.