Quo vadis, AI?
KI entwickelt sich stetig weiter - wie ist der Stand 2019? MMC Ventures und Barclays berichten über den Einsatz künstlicher Intelligenz in verschiedenen Sektoren.
Die Erfinder des Grafikprozessors tauchen ein in die Welt von Künstlicher Intelligenz und fotorealistischer Bildbearbeitung von Morgen. Mit den sogenannten GANs, den Generative Adversarial Networks, betritt der Marktführer nun den Bereich von Deep Learning und erinnert dabei mit der neuen App GauGAN zugleich an den Maler Paul Gaugin.
GauGAN ist zunächst mal eine recht unscheinbare und eher grob zusammengewürfelt wirkende App des Spitzenanbieters für Grafikprozessoren, Chipsätze, Personal Computer und Spielkonsolen. Der US-Amerikanische Entwickler wurde 1993 in Kalifornien gegründet und liegt heute bei den weltweit größten Unternehmen auf Platz 572 mit einem Börsenwert Mitte 2018 von ca. 155 Mrd. US-Dollar. Das heißeste Thema im Bereich von Deep Learning sind die generativen gegensätzlichen Netzwerken, nach ihrem englischen Begriff abgekürzt mit GANs. Sie haben das Potential ohne menschlichen Einfluss zu lernen und wurden 2014 von Ian Goodfellow noch während seiner Promotion entwickelt. Die jetzt vorgestellte App mit der KI-Technologie kann dem Menschen vor allem zeitraubende Arbeit abnehmen und macht aus einfachen Zeichnungen, egal wie schlecht sie sind, eine fotorealistische Interpretation seiner Zeichenkunst.
Um eine KI-Technologie zu trainieren, braucht man vor allem Daten. In der Welt der Kunst und der bildlichen Darstellung sind es tausende und abertausende von Fotos und Zeichnungen. Ist die Software gut gefüttert, erkennt sie über das neuronale Netz in ihr, was der Zeichner an der Maus eigentlich abbilden will. Aus einem einfachen Entwurf, einer schlechten Skizze oder einer lockeren Darstellung wird mit wenigen Klicks ein beachtliches Ergebnis. Möglich machen das die GANs, die bereits mit Millionen von Datensätzen gefüttert sind. Ihr eigentlich revolutionierender Vorteil ist aber, das nicht mehr jedes einzelne Bild für das Training vorher aufwendig beschriftet werden muss. Denn nur so konnte bisher eine Software erkennen, was auf dem Foto zu sehen ist und es in die entsprechende Kategorie abspeichern. Mit der GauGAN App von Nvidia haben die Entwickler nun nicht ein neuronales Netzwerk trainiert, sondern zwei konkurrierende Netzwerke.
Am Beispiel eines Katzenbildes kann die Funktion ganz einfach erklärt werden:
Das Diskriminatorennetzwerk in der intelligenten Anwendung hat Fotos erstellt, die KEINE Katze zeigten, aber so aussahen als wäre dort eine Katze abgebildet. Das andere Netzwerk hat nun versucht festzustellen, ob sich auf den Fotos tatsächlich eine Katze befindet oder nicht. Der eine Partner erstellt Fälschungen, der andere Partner versucht diese zu enttarnen. Die beiden gegensätzlichen Netzwerke werden als Durchbruch bezeichnet, denn während das eine versucht realistische Kopien zu erstellen, ist das andere in der Lage mithilfe der gesammelten Daten Zeichnungen zu vervollständigen. Und genau hier zeigt sich die sagenhafte Leistung von Nvidias GauGAN App.
Wer kein Talent hat und trotzdem zeichnen möchte, malt einfach drauf los. Die App mit Künstlicher Intelligenz von Nvidia erkennt anhand der KI-Technologie, um was es sich handeln soll und vervollständigt das Bild mit hochauflösenden Grafiken. So werden aus niedrigauflösenden Luftbildkarten beispielsweise hochpräzise Fotos. Alle Arten von Fotomanipulation sind in der KI-Anwendung möglich. Hohes Potential bietet die neu entwickelte Künstliche Intelligenz also für Bildbearbeiter, Fotografen, die Medienlandschaft und natürlich auch die Filmindustrie. Mit wenigen farbigen Linien oder Flächen füllt die Software ganze Landschaften aus. Dafür werden die Flächen mit einer Textur versehen und dann von der KI analysiert und in Bezug zueinander gestellt. Flüsse, Berge und andere Motive werden erkannt und durch typische Eigenschaften wie Reflexionen auf dem Wasser, Nebel über den Bergen oder Gischt am Wasserfall ergänzt. Für die Entwicklung der GauGAN App hat Nvidia mehr als eine Million gemeinfreie Bilder aus Datenbanken verwendet. Im Grunde ist die App zweigeteilt, denn die eine erstellt das Bild und die andere überprüft dessen Authentizität. Als Hardware für die KI braucht man nur ein mobiles Endgerät, auf dem die App geladen werden kann. Noch in der Beta-Version, aber mit Potential für eine baldige Vollversion.
Du willst es selbst mal ausprobieren? Hier kannst du GauGAN testen.
Bisher ist GauGAN auf Landschaftsbilder limitiert. Objekte wie Häuser, Autos oder Einrichtungsgegenstände bringen die App mit Künstlicher Intelligenz an ihre Grenzen. Noch, denn eins ist sicher: Für die Zukunft wird die Nvidia App weiterentwickelt werden. Für Menschen wird es damit aber auch noch schwerer zu erkennen, was ist real und was nicht. Schatten, Lichtreflexionen und spezifische Details stellen für die App keine Probleme dar. Im Linken Feld wird der virtuelle Pinsel angesetzt, im rechten das GAN-basierte Bild generiert. Das funktioniert schon recht gut auf kleinem Display und auch wenn es an der Qualität der Ergebnisse noch häufig mangelt, darf man gespannt sein, was Nvidia als nächstes Update für die in der Beta-Version erhältlich App herausbringt. Mit digitalem Farbeimer, Stift, Pinsel sowie einer hochwertigen KI-Anwendungen lassen sich in Zukunft noch mehr fotorealistische Bilder erzeugen. Auch der Einsatz in bewegten Bildern, also Videos, ist zukünftig denkbar.
Warum auf die Zukunft warten, wenn es sie jetzt schon gibt?
Wir beraten Dich und finden die optimale Lösung für den KI-Einsatz in Deinem Unternehmen. Geh jetzt mit uns den Weg der digitalen Transformation für Dein Unternehmen.
Mehr erfahren
Kommentare
Einen Kommentar schreiben