Bekanntlich ist alles schon lange vor uns erfunden worden. Deshalb schöpfen die Wissenschaftler ihre Inspiration oft einfach aus der Natur.
So ist die Technologie der künstlichen neuronalen Netze (KNN) entstanden, die die Struktur und die Prinzipien des menschlichen Gehirns nachahmt. Obwohl die Entwicklung der neuronalen Netze auf die Mitte des XX. Jahrhunderts zurückgeht, haben sie in den letzten Jahren einen wahren Boom erlebt, so dass ihr Anwendungsbereich jetzt drastisch, und zwar um ganze 270 Prozent zugenommen hat. Heute können sie von jedermann genutzt werden – auch von Unternehmen! Und das völlig kostenlos.
Wie das funktioniert: Struktur, Prozesse und menschliches Gehirn
Genauso wie unser Gehirn bestehen alle neuronalen Netze aus einem Satz von Schichten, und in jeder davon laufen parallel zueinander Prozesse ab, die miteinander verbunden sind:
-
Eingabeschicht. Diese Schicht kann man mit Dendriten im menschlichen Gehirn vergleichen, wo die Neuronen-Impulse entstehen.
-
Verdeckte Schicht. Diese Schicht liegt zwischen der Eingabe- und der Ausgabeschicht, deshalb gilt sie als Kernschicht. Hier werden die synaptischen Kontakte gebildet und die eingehenden Datensätze verarbeitet, die daraufhin an die Ausgabe-Ebene weitergeleitet werden.
-
Ausgabeschicht. Hierher wird das geleitet, was der Nutzer des neuronalen Netzwerkes sieht, das heißt, der endgültige Datensatz, der bereits verarbeitet und fertiggestellt worden ist.
Man kann die Abläufe im neuronalen Netz als Abfolge von Etappen darstellen, die etwa so aussehen könnten:
Etappe 1. Nehmen wir an, es handelt sich um ein kreatives neuronales Netzwerk für die Erstellung von Inhalten wie MidJourney (auf den wir weiter unten näher eingehen wollen). In diesem Fall erhält das neuronale Netzwerk eine Anfrage, die aus Schlüsselwörtern besteht, die es dann verarbeiten muss. Zum Beispiel: "Baum", "Haus", "Garten".
Etappe 2. Das neuronale Netz übersetzt Wörter in digitale Codes, die als Vektoren bezeichnet werden, denn das neuronale Netz spricht eigentlich in der Sprache der Vektoren. Ohne diese Etappe wäre das Netz einfach nicht in der Lage, zu verstehen, was der Nutzer meint und wonach er fragt.
Etappe 3. Die Wörter werden in Form von Vektoren weitergeleitet, und zwar an die bereits erwähnte verdeckte Schicht, wo auf dieser Grundlage im neuronalen Netzwerk ein Text- oder Bildentwurf entsteht, der wie unscharfe Balken und Pixel aussieht.
Etappe 4. Hier wird der Entwurf ergänzt. Hinzu kommen Farbe, Struktur, zusätzliche Merkmale und die Beleuchtung. Diese Einzelheiten werden anderen Vektoren (Schlüsselwörtern) entnommen, die der Nutzer zusätzlich angegeben hat. Wenn einer der Vektoren zum Beispiel „Cyberpunk“ lautete, dann kann das neuronale Netz Neon, entsprechende Aushängeschilder usw. hinzufügen.
Übrigens: bei jeder Etappenabfolge lernt das neuronale Netzwerk kontinuierlich etwas dazu. Dadurch bereichert es seine „Bibliothek“ mit neuen Daten und den Wegen zu deren Umsetzung. Das nennt man maschinelles Lernen, und wenn man das mit dem Fremdsprachenlernen vergleicht, dann sieht das der Sprachpraxis ähnlich, das heißt: je mehr man mit einem Muttersprachler kommuniziert, desto besser versteht man ihn, und man beginnt, immer mehr Vokabeln zu nutzen. So lernt das neuronale Netzwerk, die Nutzer besser zu verstehen, und nach und nach erweitert es sein Instrumentarium aufgrund der bisher gewonnenen Erfahrungen.
Wie setzt man heute die neuronalen Netzwerke im Business ein: Beispiele und Möglichkeiten
Rein theoretisch können die neuronalen Netze ziemlich alles: Bilder zeichnen, Personen nach ihrer Beschreibung suchen, Geschäftsideen entwickeln und vieles andere mehr. Wenn wir aber über praktische Funktionen sprechen, die von IT-Firmen perfektioniert worden sind und sofort eingesetzt werden können, dann können die neuronalen Netze vor allem Folgendes:
-
Beliebige Mengen an Informationen bearbeiten, auch wenn diese Mengen sehr groß sind, zum Beispiel, um eine Kontaktliste zu erstellen oder Dokumente zu prüfen. Neuronale Netze sind das ideale Werkzeug für die Lösung komplexer und monotoner Aufgaben, wenn das Unternehmen keine menschlichen und zeitlichen Ressourcen verschwenden will.
-
Prognostizieren. Wechselkurse, Wetter, Umsätze, Kapitalrendite, Marketingeffizienz: all das und noch viel mehr kann von neuronalen Netzen auf der Grundlage früherer Erfahrungen und aktueller Leistungen bewertet und vorhergesagt werden, was dem Unternehmen zu intelligenteren und schnelleren Entscheidungen verhilft.
-
Daten suchen und verarbeiten. Genauso wie die neuronalen Netze bereits empfangene Daten verarbeiten können, können sie die benötigten Informationen selbständig finden und diese sogar aus einer Reihe von Variablen oder Bildern abrufen, um z. B. Statistiken zu einem Bericht zusammenzufassen und Zahlen in Musik zu verwandeln.
Der Hauptvorteil der neuronalen Netze ist jedoch ihre Fehlerbeständigkeit. Das ist das, worüber andere Programme und Dienste nicht verfügen. Dank ihrer fortschrittlichen Struktur, die auf der Grundlage der Struktur des menschlichen Gehirns aufgebaut ist, funktionieren die neuronalen Netze auch bei einem oder mehreren Ausfällen. Deshalb sind sie für absolut jeden Bereich der Wirtschaft und Industrie geeignet, in dem eine hohe Stabilität erforderlich ist, wie z. B. in der Raumfahrt und im Ingenieurwesen.
Als besonders aussichtsreich jedoch gilt die Einführung der neuronalen Netzwerke heute im Bereich des E-Commerce. Mithilfe von neuronalen Netzen kann man heute zum Beispiel hochintellektuelle und adaptive Chatbots erzeugen, die die Kunden selbständig bedienen, oder das Empfehlungssystem personifizieren, den Versand optimieren, den Content in den sozialen Netzwerken anpassen und vieles andere mehr tun. Schon heute werden die neuronalen Netze beim E-Commerce von Amazon, Google Play und Walmart eingesetzt, um das Verhalten der Kunden zu analysieren, ihre bisherigen Einkäufe und Wünsche auszuwerten und ihnen später personifizierte Gutscheine und Rabatte anzubieten.
Ein weiteres Paradebeispiel dafür, wie neuronale Netze den Unternehmen das Leben erleichtern, ist die darauf basierende App PixelDTGAN. Mit ihrer Hilfe kann jeder Online-Shop viel Geld an den Diensten von Fotografen sparen: Das neuronale Netz PixelDTGAN hebt automatisch Kleidungsstücke an Modellen hervor, egal ob es sich um eine Person, eine Schaufensterpuppe oder einen auf dem Tisch liegenden Gegenstand handelt, und stellt daraus die erforderliche Collage oder Vitrine zusammen.
Obwohl vielen Berufen das Aussterben durch künstliche Intelligenz vorhergesagt wird, wird sie Menschen nicht ersetzen können – zumindest im nächsten Jahrzehnt nicht. Dennoch ermöglichen es die neuronalen Netzwerke, die Arbeit des menschlichen Personals im Einzelhandel zu optimieren. Hier nur ein Beispiel: Ein Offline-Walmart-Laden in Levittown, einer ländlichen Stadt im Bundesstaat New York, verwendet ein neuronales Netzwerk, um die Regale zu überwachen. Die Kamera erkennt in Echtzeit, ob das Verfallsdatum des Produkts bald abläuft oder ob es im Regal nicht mehr vorrätig ist und nachgeliefert werden muss. Dann werden die Verkäufer telefonisch darauf hingewiesen, dass sie etwas unternehmen müssen.
Der Finanzsektor und das Bankwesen sind ein weiterer attraktiver Bereich für die Entwicklung der neuronalen Netze, weil diese, wie schon erwähnt, über eine gut entwickelte Prognose- und Datenverarbeitungsfunktion verfügen. So trifft zum Beispiel die auf ihrer Grundlage entwickelte Banksoftware SAS selbständig Entscheidungen über Kreditvergabe an Kunden auf der Grundlage einer Analyse ihrer Zahlungsfähigkeit, und sie erstellt eine Liste mit optimalen Bankdienstleistungen für die Kunden. Das neuronale Netzwerk Finprophet prognostiziert die Änderung der Kurse von Kryptowährungen, Aktien und Fiatgeld, was das Leben der Investoren wesentlich erleichtert.
Ein ganz anderer Anwendungsbereich und eine Unterart der künstlichen neuronalen Netzwerke sind die neuronalen Netze für Content-Generierung, die eine riesige Quelle von Perspektiven für das Business darstellen und deshalb von besonderer Bedeutung sind.
KNN als Werkzeug zur Erstellung markenorientierter Inhalte
Der durch die künstliche Intelligenz erzeugte Content kann sowohl im Marketing als auch in der Bildung, im Journalismus, im Blogging usw. eingesetzt werden. Dabei handelt es sich um die Inhalte, die nicht von Menschen, sondern von Computeralgorithmen auf der Grundlage eingegebener Anfragen und Daten erstellt wurden. Neuronale Netze ermöglichen es also, innerhalb eines kurzen Zeitraums und mit geringem Ressourcenaufwand hochwertige und umfangreiche Inhalte zu erstellen.
Zurzeit kann man mithilfe der neuronalen Netzwerke drei Arten von Inhalten generieren:
-
Textuelle Inhalte. Dank Sprachmodulen und Techniken zur Verarbeitung der natürlichen Sprache (NLP) können moderne neuronale Netze sogar Werke der schöngeistigen Literatur erschaffen, die den vorgegebenen Kriterien und der Geschichte entsprechen. Meistens generieren neuronale Netze jedoch einfache und kurze Werbetexte oder Erzählungen (Phrasen, Fragen) für den Chatbot. Sie tun dies auf der Grundlage von Vorlagen und anderen Texten, die im Internet vorhanden sind, so dass der generierte Inhalt vom Menschen zusätzlich überprüft werden muss, weil das neuronale Netzwerk nur die Grammatik, aber keine Logik garantieren kann.
-
Bilder. Das sind beliebige Bilder, Artefakte und Illustrationen, die von Computeralgorithmen unter Verwendung visueller Effekte und voreingestellter Parameter erzeugt werden. Adobe und NVIDIA haben auf dieser Grundlage bereits kostenpflichtige professionelle Programme zur Erstellung von Bildern auf Unternehmensebene auf den Markt gebracht.
-
Audio-Inhalte. Die neuronalen Netze können jetzt sogar Ton, Musik und menschliche Stimmen erzeugen, was für Codierung und Tonaufnahme neue Dimensionen eröffnet. Die Tonspuren aus neuronalen Netzen können später für Synchronisierung von Filmen, Erstellung von Werbespots, Bearbeitung von YouTube-Videos, für die Entwicklung von Videospielen usw. verwendet werden.
Mit neuronalen Netzen kann man Inhalte für jedes Zielgruppensegment individuell erstellen und dabei dessen Bedürfnisse, Vorlieben und Präferenzen berücksichtigen. Auf diese Weise erhöht man sowohl die Marken-Attraktivität als auch das Engagement des Publikums.
Dabei ist jedoch zu bedenken, dass alle Inhalte vom neuronalen Netzwerk auf der Grundlage derjenigen Daten erstellt werden, die es im Internet findet, weil das maschinelle Lernen auf der Verarbeitung bestehender Daten aus fremden Quellen beruht. In diesem Zusammenhang stellt sich die Frage des Urheberrechts, die bis heute offen bleibt. Deshalb raten wir davon ab, die von neuronalen Netzen erstellten Inhalte zu monetarisieren und auch sonst zu vermarkten! Obwohl das Gesetz die Inhalte der neuronalen Netzwerke noch nicht berücksichtigt, sind schon viele öffentliche Skandale und sogar Gerichtsklagen von Künstlern gegen neuronale Netzwerke bekannt.
Die besten neuronalen Netzwerke, die als Künstler fungieren und visuelle Inhalte erstellen können
Gute Bilder sind für jedes Unternehmen erforderlich. Als eines der bekanntesten neuronalen Netzwerke zur Erstellung von Bildern gilt derzeit MidJourney. Es wurde von dem jungen Wissenschaftler und Unternehmer David Holtz entwickelt, einem Absolventen der Fakultät für angewandte Mathematik an der Universität North Carolina. MidJourney funktioniert auf der Grundlage des Messengers Discord, wo der Nutzer in einem speziellen Chat eine Reihe von Kriterien und Hinweisen für das neuronale Netzwerk eingeben muss, je nachdem, was für ein Bild er erstellen möchte. Bitte beachten Sie, dass hierzu ein kostenpflichtiges Abonnement erforderlich ist, denn die Anzahl der kostenlosen Versuche ist begrenzt! Besonders gut hat sich MidJourney bei der Erstellung von Fantasy- und Sci-Fi-Szenen sowie beim Modellieren von Konzepten zu Videospielen und bei Landschaften bewährt.
DALL·E 2: das ist ein weiteres Programm für die künstliche Intelligenz, das vom US-amerikanischen IT-Unternehmen OpenAI entwickelt wurde und Bilder verschiedener Stile und Formate auf der Grundlage der textuellen Beschreibungen generiert. Dazu benutzt es über 10 Milliarden Trainingsmodelle, und es kann Daten in absolut jeder natürlichen Sprache interpretieren, obwohl Englisch hier natürlich am besten verstanden wird. DALL-E 2 lernt auch von Archivfotos und verarbeitet nach Meinung der Nutzer viel besser als MidJourney diejenigen Bilder, die mehr als zwei Objekte enthalten. Dennoch gewinnt MidJourney in den meisten Umfragen aufgrund seiner künstlerischen Gestaltungsfähigkeit die Oberhand.
Wenn es um visuelle Inhalte geht, wendet man sich ebenso oft an Stable Diffusion: das ist ein Modell, das Text-Codierung einsetzt, um das Bild den vorgegebenen Hinweisen anzupassen.
Alle neuronalen Netzwerke dieses Typs, die für die Erstellung der visuellen Inhalte genutzt werden, funktionieren auf der Grundlage der Methode, die als „Verbreitung“ bekannt ist. Im Rahmen der Erstellung eines neuen Bildes sieht das wie folgt aus:
-
Das neuronale Netz beginnt den Lernprozess, d. h., es sieht sich Archivfotos an, von denen es etwa zehn Millionen gibt, und wählt diejenigen Bilder aus, deren Codes mit den angegebenen Schlüsselwörtern übereinstimmen.
-
Dann fügt das neuronale Netz dem Bild die Geräusche hinzu, wodurch die Bilder vermischt und in eine chaotische Pixelmenge verwandelt werden.
-
Danach entfernt das neuronale Netz die Geräusche wieder und stellt die gemischten Daten wieder her. Dieser Vorgang wird mehrmals wiederholt, so dass nach unzähligen Überschneidungen und Unterbrechungen ein Originalbild entsteht.
-
Am Ende kann das neuronale Netz eine zusätzliche Rauschunterdrückung vornehmen, um das Bild realistischer zu gestalten, und es kann seine eigenen Änderungen hinzufügen, die es bei der Verarbeitung früherer Anfragen "gelernt" hat.
Wo und wie kann man die vom neuronalen Netzwerk generierten Inhalte benutzen?
Da sich die mit neuronalen Netzen erstellten Inhalte nicht monetarisieren lassen, ist ihr Anwendungsbereich zwar etwas eingeschränkt, bleibt aber immer noch breit genug, insbesondere für Unternehmen. Hier sind einige Einsatzvarianten für neuronale Netzwerke:
Erstellung von Werbebannern
MidJourney erstellt häufig Werbebanner für Unternehmen in der ganzen Welt. Mit MidJourney brauchen wir kein spezielles Grafik- oder Designerteam einzustellen und nicht eine Woche lang zu warten, bis das visuelle Produkt fertiggestellt ist. Mit MidJourney dauert es keine fünf Minuten, bis uns ein Banner vorliegt. Danach kann das generierte Bild zum Beispiel auf Veranstaltungsplakaten oder auf Instagram gepostet werden, wie es das San Francisco Ballet Studio getan hat, um seine Inszenierung des „Nussknackers“ zu bewerben:
Planung und Präsentation von Marketing-Kampagnen
Nehmen wir an, wir müssen der Geschäftsführung oder den Investoren ein neues Projekt vorstellen, sie von den Vorteilen unserer Idee überzeugen und für die Umsetzung eine Genehmigung bekommen. Es ist hervorragend, wenn wir mit Zahlen allein die Effektivität nachweisen können. Was wäre aber, wenn wir diese Effektivität oder das Endprodukt selbst visualisieren könnten? Zum Beispiel, um vorzuführen, wie das neue Telefonmodell oder die neue Komposition im Werbevideo aussehen würde. Durch das neuronale Netz wird es uns somit möglich, den Forschungsprozess zu beschleunigen und die Planung zu strukturieren.
Wir müssen auch nicht unbedingt die Inhalte verwenden, die vom neuronalen Netz erstellt worden sind. Es reicht, wenn wir die vom Netz angebotenen Ideen übernehmen. MidJourney können wir gut gebrauchen, wenn wir mit einem Team von Künstlern ein Brainstorming durchführen, um zum Beispiel ein Rebranding oder ein neues Konzept für die Produktpositionierung in die Wege zu leiten.
Erstellung von Design-Elementen
Selbstverständlich wird das neuronale Netz die Gestaltung der Website nicht ganz für uns übernehmen können, aber es kann uns Vorschläge zu einigen Elementen machen, die wir verwenden und unseren Zielen anpassen können. Das sind:
-
Logos,
-
Icons für mobile Apps oder Abschnitte,
-
Skizzen und Schablonen,
-
CTA-Buttons.
Hier sind zum Beispiel die Icons von MidJourney, die sich für eine App zur Lieferung von asiatischem Essen oder für ein Spiel eignen würden, das mit der Zubereitung der Ramen-Suppe zusammenhängt:
Erstellung von Bildern für den Blog
Der Hauptschlüssel zur Popularität des Blogs besteht darin, dass die Beiträge regelmäßig veröffentlicht werden sollen. Geben wir aber zu: nur wenige Menschen können es sich leisten, jeden Tag oder für eine ganze Woche im Voraus hochwertige Fotos zu erstellen. Und gerade da kommen uns die neuronalen Netze zur Hilfe! Sie helfen uns nicht nur dabei, uns auf dem Markt zu behaupten, sondern sie veranschaulichen auch das beschriebene Ereignis oder die Ideen, die wir unseren Followern in einem Beitrag überbringen wollen. Außerdem sparen wir auf diese Weise die Kosten für Stock-Imagery-Dienste und die Zeit, die wir benötigen, um die Bilder einfach durchzusehen. Darüber hinaus verfügt nicht jeder Blogger über die notwendigen Fähigkeiten zur Erstellung von Fotos oder die Ressourcen, um erfahrene Fachleute zu beauftragen.
Es besteht kein Zweifel daran, dass die künstlichen neuronalen Netze in den kommenden Jahren die Wirtschaft und die Kunst weiter umgestalten werden. Das bedeutet, dass die neuronalen Netze sich selbst verbessern, ihre Algorithmen vervollkommnen und die Qualität ihrer Arbeit steigern werden. Die neuronalen Netze überraschen allerdings nicht nur durch ihre hervorragenden Aussichten und Möglichkeiten, sondern auch durch die Schwierigkeiten bei ihrer Verwendung. Gerade deshalb beschreiben wir im nächsten Artikel des Lectera Magazins, wie man mit MidJourney in der Praxis arbeiten kann!