von Benedikt Krauss, k+k Akademie

Was ist eigentlich Machine Learning?

Jede Sekunde werden weltweit circa 30 Terabyte an Daten erfasst. Neue Entwicklungen wie das Internet der Dinge fördern das Daten-Wachstum. Diese Menge an wertvollen Informationen zu analysieren und zu verstehen, führt bereits jetzt zu einem entscheidenden Wettbewerbsvorteil. Allerdings können die großen Datenmengen in keiner Weise manuell von Menschen analysiert werden. Die Lösung: Machine Learning.

Daten intelligent vernetzen

Machine Learning, deutsch Maschinelles Lernen, gehört in das Themenfeld der Künstlichen Intelligenz (KI)/Artificial Intelligence. Ähnlich wie Thermodynamik, Mechanik und Quantenphysik Teilgebiete der Physik sind. KI selbst ist eine Teildisziplin der Informatik.

Machine Learning ist ein Oberbegriff für die „künstliche“ Generierung von Wissen aus Erfahrung. Was bedeutet das konkret? Der Computer lernt anhand von Beispielen und erkennt mit Hilfe von Algorithmen wiederkehrende Muster und Gesetzmäßigkeiten. Darauf basierend kann er eigenständig Lösungen für Probleme finden, Zusammenhänge erkennen und Rückschlüsse ziehen.

Der Einsatz von Machine Learning

Im Alltag begegnet uns Machine Learning bereits an vielen Stellen. Denn Aufgaben, die bisher von Menschen durchgeführt wurden, können dank der Technologie immer mehr von Computer-Systemen übernommen werden: wie zum Beispiel das Erkennen von Sprache, Spamfilter in PCs, das Fahren eines Autos oder die Gesichtserkennung beim Verwalten von Bildern.

Darüber hinaus erledigt Machine Learning Aufgaben, die über die menschlichen Kapazitäten hinausgehen wie das Analysieren von großen und komplexen Datensätzen. So überwachen Computersysteme beispielsweise Kreditkartenaktivitäten, um frühzeitig Unstimmigkeiten zu erkennen und Kreditkartenbetrug effizienter aufzudecken.

Machine Learning-Tools sind erweiterbar in ihrer Funktion, da sie sich dem ständigen Input des Benutzers anpassen und immer besser werden. Diese Anpassungsfähigkeit wird zum Beispiel beim Entziffern von handgeschriebenen Texten oder bei der Erkennung von Spam-Mail eingesetzt.

Arten des Machine Learning

Die praktische Umsetzung von Machine Learning geschieht mittels Algorithmen. Die verschiedenen Algorithmen lassen sich in ein Schema einteilen. Das Schema besteht aus Supervised Learning, Unsupervised Learning, Semi-Supervised Learning und Reinforcement Learning.

Supervised Learning

Beim Supervised Learning (dt. = überwachtes Lernen) lernt der Algorithmus eine Funktion aus gegebenen Paaren von Ein- und Ausgaben. Das heißt, es gibt Daten, bei denen die „richtigen Antworten“ bekannt sind, weil die Daten markiert („gelabelt“) wurden.

Das System bekommt zum Beispiel mehrere Bilder mit der Information, was genau auf einem Bild zu sehen ist. Während der Lernphase des Systems stellt ein „Lehrer“ den korrekten Funktionswert zu einer Eingabe bereit, wie beispielsweise: auf Bild 1 ist ein Affe abgebildet, auf Bild 2 ist es ein Hund. Der Algorithmus macht wiederholende Vorhersagen über die Trainingsdaten und wird vom Lehrer korrigiert. Ziel ist es, dass der Algorithmus nach mehreren Rechengängen mit unterschiedlichen Ein- und Ausgaben fähig ist, eigenständig die richtigen Assoziationen herzustellen.

Einige Beispiele für Supervised Learning sind das Erkennen von Handschrift, Spam oder auch Sprachassistenten werden immer besser mittels überwachtem Lernen.  

Unsupervised Learning

Der Algorithmus erzeugt beim Unsupervised Learning (dt. = unüberwachtes Lernen) für eine gegebene Menge von Eingaben ein Modell, das die Eingaben beschreibt und Vorhersagen ermöglicht. Anders als beim Supervised Learning geht es beim Unsupervised Learning um Daten, die nicht markiert, sprich gelabelt sind. Es gibt Eingangsdaten, aber keine entsprechenden Ausgangsvariablen, also richtigen Antworten.

Die Algorithmen sind ihren eigenen Möglichkeiten überlassen, um charakteristische Strukturen in den Daten zu entdecken und darzustellen. Das bedeutet anhand eines Clustering-Verfahrens zum Beispiel, sucht das System in den Daten nach Gemeinsamkeiten, die es in mehrere Kategorien einteilt, die sich durch charakteristische Muster voneinander unterscheiden. Der Algorithmus erstellt die Kategorien selbständig, nach denen es die Eingaben einteilt, wie beispielsweise die Gruppierung von Kunden nach dem Kaufverhalten.

Unsupervised Learning wird beispielsweise bei Gesichtserkennungssoftware verwendet. Das Betriebssystem iOS von Apple nutzt diese Technologie. Dort werden alle Bilder des Anwenders durchsucht und Bilder mit gleichen Gesichtern in einem Ordner gesammelt.

Semi-Supervised Learning

Das Semi-Supervised Learning (dt. = teilüberwachtes Lernen) ist eine andere Art des Supervised Learning. Beim Semi-Supervised Learning sind nur für einen Teil der Eingaben die passenden Ausgaben bekannt. Ein gutes Beispiel ist ein Fotoarchiv, in dem nur ein Teil der Bilder beschriftet ist (z.B. Hund, Katze, Person) und die meisten Bilder nicht beschriftet sind. Googles TensorFlow wurde per Semi-Supervised Learning trainiert. Dabei wurde der Software eine große Menge an verschiedenen Bildern vorgesetzt. Ein Teil der Bilder wurde von Menschen mit exakten Überschriften versehen. TensorFlow verarbeitete diese Informationen und lernte dabei, auch bei unbekannten Bildern exakte Angaben zu machen, was auf dem Bild zu sehen ist.

Reinforcement Learning

Beim Reinforcement Learning (dt. = bestärkendes Lernen) lernt der Algorithmus durch „Belohnung“ und „Bestrafung“ eine Taktik, wie in potenziell auftretenden Situationen zu handeln ist. Das bedeutet, der Agent (= das System, zu dem die Lernkomponente gehört) sucht die beste Strategie, um in einer Umgebung ein Ziel zu erreichen. Er führt also Aktionen à la „trial and error“ aus und erreicht irgendwann zufällig das Ziel. Auch unser Experiment mit den Flappys aus den vorausgegangenen Blogartikeln funktioniert mit Reinforcement Learning.

Googles DeepMind wurde teilweise per Reinforcement Learning trainiert. DeepMind ist eine KI, die durch Machine Learning kein vordefiniertes Ziel oder eine vordefinierte Aufgabe hat, wie es bei den meisten KIs üblich ist. Sie kann flexibel eingesetzt werden. So kann DeepMind beispielsweise nicht nur 80er und 90er Arcade Games auf Weltrekordniveau spielen, sondern auch den weltbesten Go Spieler besiegen.

Fazit

Tummelten sich selbstlernende Programme bis vor wenigen Jahren noch ausschließlich in Projekten von Technologieorganisationen und Forschungseinrichtungen, sind sie heute im Geschäftsleben und im Alltag angekommen. Viele Menschen kommen in Kontakt mit selbstlernenden Systemen, ohne es zu wissen: zum Beispiel bei der personalisierten Online-Werbung.

Machine Learning wird für Unternehmen zunehmend interessanter, wenn es darum geht, Daten intelligent zu verknüpfen und Vorhersagen zu treffen. Die Vorzüge sind oftmals Zeit- und Kostenvorteile sowie die Steigerung der Wettbewerbsfähigkeit.


Lesen Sie auch folgende Blogposts zum Thema:

Sprechen Sie Algorithmus?

KI-Landschaft Baden-Württemberg

TEIL 2 von Dumm stirbt, schlau gewinnt: Warum KI „Tierversuche“ braucht?

Dumm stirbt, schlau gewinnt: Warum KI „Tierversuche“ braucht?

Künstliche Intelligenz: Sie sind längst unter uns

 

Jetzt schon mehr über KI erfahren!

Sie wollen erfahren, welche Benefits Machine Learning Ihrem Unternehmen bieten kann?

Hier mehr erfahren

Zurück

Einen Kommentar schreiben