Adil Moujahid: Unpacking the Progress and Potential of Generative AI

Adil_Moujahid_Artificial_Intelligence_OYSTECxv3Xga5bbZJLF

Adil Moujahid, KI-Experte bei NTT DATA EMEAL, unterhält sich mit Gernot Kapteina, dem Gründer von OYSTEC, über die beeindruckende Evolution der Generativen KI und den Erfolg von ChatGPT. In diesem packenden Interview erkunden sie die Meilensteine in der Entwicklung der KI, beleuchten sowohl bedeutende Durchbrüche als auch nuancierte Herausforderungen und bieten tiefe Einblicke in Anwendungen, Ethik und zukünftige Auswirkungen von KI-Technologien. Dieser Beitrag vermittelt den Lesern ein umfassenderes Verständnis der digitalen KI-Revolution.

Adil, es ist eine Freude, wieder über das Thema KI zu sprechen. Wenn Du die Fortschritte seit unserem letzten Gespräch im Oktober 2020 über KI betrachtest, wie würdest Du heute die bedeutendsten Aktualisierungen oder Durchbrüche der letzten drei Jahre beschreiben?

Moujahid: Vielen Dank, Gernot, für diese Einladung; es ist immer inspirativ, sich mit Dir auszutauschen. Seit unserem letzten Gespräch haben wir massive Fortschritte in den Möglichkeiten und Anwendungen der KI erlebt. Insbesondere die Generative KI hat erhebliche Wellen geschlagen. Zum Beispiel haben Produkte wie DALL·E 2 und Midjourney aufgrund ihrer Fähigkeit, detaillierte Bilder aus Textbeschreibungen zu erzeugen, erhebliche Aufmerksamkeit erregt. Aber das herausragende in diesem generativen Bereich ist ChatGPT. Mit über 100 Millionen Nutzern ist klar, dass ChatGPT eine entscheidende Rolle dabei gespielt hat, KI in den Mainstream zu bringen und sie nahtlos in die täglichen Abläufe vieler Menschen zu integrieren.

Könntest Du jeweils eine kurze Begriffserklärung zu Generative KI, Large Language Models (LLM) und ChatGPT geben?

Moujahid: Sehr gern: Generative KI ist eine Form der künstlichen Intelligenz, die neuen Inhalt erstellt, sei es Text, Bilder oder andere Medien. Eine Schlüsselart der generativen KI sind große Sprachmodelle (LLMs), wobei die GPT-Serie von OpenAI ein Paradebeispiel ist. Diese LLMs wurden mit massiven Textmengen trainiert und funktionieren ähnlich wie fortschrittliche Auto-Vervollständigungs-Tools, indem sie kohärente und kontextuell relevante Sätze vorhersagen und generieren.

Sie werden als Basismodelle verwendet, weil sie eine Grundstruktur bieten, die für spezielle Aufgaben in Anwendungen zur Verarbeitung natürlicher Sprache (NLP) maßgeschneidert werden kann. ChatGPT verkörpert diese Technologie als konversationsfähigen Chatbot und integriert nahtlos die Fortschritte über GPT-3.5 bis aktuell hin zu einem noch einmal verbesserten GPT-4.

Im Juni 2020 veröffentlichte OpenAI GPT-3, und unser letztes Interview fand ebenso im Oktober 2020 statt. Warst Du zu diesem Zeitpunkt über den damaligen Stand von ChatGPT bereits gut informiert und hätten wir darüber nicht auch schon während unseres letzten Gesprächs vor drei Jahren diskutieren sollen?

Moujahid: Stimmt; tatsächlich war ich mir des Starts von GPT-3 im Juni 2020 bewusst. Und ich hatte das Glück, frühzeitig darauf zugreifen zu können und habe sogar einige Zeit damit verbracht, seine Fähigkeiten zu erkunden. Obwohl es damals schon vielversprechende Fähigkeiten zeigte, erreichte es damals aber noch nicht die Möglichkeiten, die ChatGPT später bot. In unserem vorherigen Interview haben wir eine breite Palette von KI-Themen behandelt, und zu diesem Zeitpunkt schien GPT-3 noch nicht so entscheidend gewesen zu sein. Erst mit der Einführung von ChatGPT Ende 2022 wurde der bemerkenswerte Fortschritt von OpenAI deutlich, was erst dann darauf hindeutete, dass diese Modelle die Bühne für einen Generationenwechsel in dieser Technologie bereiten.

Kannst Du einen kurzen historischen Überblick über die Verarbeitung natürlicher Sprache (NLP) geben und erklären, wo große Sprachmodelle in diese Story passen? Außerdem, welche Faktoren haben zur Entwicklung und zum Erfolg von ChatGPT beigetragen?

Moujahid: Die Evolution der Verarbeitung natürlicher Sprache (NLP) war sowohl faszinierend als auch transformativ. In ihren Anfängen, während der 1950er und 1960er Jahre, wurde die NLP von regelbasierten Systemen dominiert. Diese Systeme, obwohl bahnbrechend, waren begrenzt in ihrem Umfang. Als wir in die 1990er und 2000er Jahre übergingen, begann man, sich auf statistische Methoden und maschinelles Lernen zu stützen, die eine nuanciertere Textanalyse boten, aber oft ein tieferes Sprachverständnis verfehlten.

Ein bedeutender Sprung nach vorne erfolgte in den 2010er Jahren mit der Einführung von Wort-Einbettungen, insbesondere des Word2Vec-Modells. Um diese Leistung zu veranschaulichen, betrachte das berühmte Beispiel "König - Mann + Frau = Königin". Dies zeigt, wie Einbettungen Beziehungen und semantische Bedeutungen zwischen Wörtern auf eine Weise erfassen konnten, wie es vorherige Modelle nicht konnten. Kurz darauf tauchten Transformer-Architekturen auf, die noch tiefere sprachliche Einsichten boten und den Weg für große Sprachmodelle (LLMs) ebneten.

Der Wechsel von GPT-3 zu ChatGPT handelte nicht nur von größeren Modellen, sondern auch von intelligenteren Trainingstechniken. Eine entscheidende Methode war das Reinforcement Learning aus menschlichem Feedback (RLHF). Mit diesem lernten Modelle aus menschlichen Interaktionen, um ihre Ausgaben fein abzustimmen. Diese direkte Feedback-Schleife machte ChatGPT-Antworten nicht nur relevant, sondern auch mehr ausgerichtet, wie Menschen kommunizieren, und markierte einen bemerkenswerten Fortschritt in dem Feld.

Welche möglichen Vorteile und Herausforderungen bieten Große Sprachmodelle (LLMs)?

Moujahid: Große Sprachmodelle (LLMs) bieten das Potenzial für menschenähnliche Leistung kombiniert mit schneller Verarbeitung im großen Maßstab, was eine Fülle von Möglichkeiten eröffnet. Unternehmen können von verbesserter Automatisierung profitieren, die Betriebsabläufe straffen und die Effizienz steigern. Nutzer können auch verbesserte Erfahrungen erwarten, da diese Modelle nahtlos in bestehende Tools und Plattformen integriert werden. Zudem könnten LLMs die Schaffung völlig neuer Produkte und Dienstleistungen katalysieren und damit eine bedeutende Verschiebung in der Innovation markieren.

Doch mit diesen Vorteilen kommen auch erhebliche Risiken. Es besteht die Möglichkeit des Missbrauchs, mit Bedenken bezüglich Spamming, Verbreitung von Fake News und Identitätsanmaßung. Die Frage des geistigen Eigentums entsteht: Wem gehört wirklich der Inhalt, den diese Modelle erzeugen? Dazu kommen ethische Bedenken, die Angelegenheiten wie Fairness, Transparenz und sogar Umweltauswirkungen umfassen. Wenn wir das Potenzial von LLMs nutzen, ist es entscheidend, diese Herausforderungen sorgfältig zu navigieren.

Kannst Du einige spezifische Anwendungsfälle hervorheben, für die LLMs besonders wichtig sind?

Moujahid: Große Sprachmodelle (LLMs) haben sich als transformative Werkzeuge für diverse Industrien erwiesen und verändern die Art und Weise, wie Aufgaben angegangen und ausgeführt werden. Zum Beispiel sind sie bei der Beantwortung von Fragen unschätzbar geworden, nicht nur wegen ihrer Fähigkeit, Informationen abzurufen, sondern auch wegen ihres nuancierten Verständnisses komplexer Anfragen, was genauere Ergebnisse gewährleistet, als sie von Menschen allein zu leisten imstande wären.

Im Kundenservice z.B. bieten LLM-gesteuerte fortschrittliche Chatbots ein nahtloseres Erlebnis, indem sie Nutzerbedürfnisse antizipieren und kontextualisierte Antworten liefern. Der Nutzen von LLMs erstreckt sich auch auf den Bereich des Datenmanagements. Sie sind in der Lage, große Textmengen effizient zusammenzufassen, lange Dokumente in prägnante, verständliche Zusammenfassungen zu verwandeln. Ihre Parsing-Fähigkeiten helfen dabei, Schlüsselinformationen zu extrahieren und zu kategorisieren, und Prozesse zu straffen, die früher umfangreiche manuelle Eingaben erforderten.

Auch im Bereich der Softwareentwicklung sind LLMs ein Game-Changer. Sie helfen Entwicklern nicht nur dabei, große Codeblöcke zu verstehen, sondern können auch Code-Snippets basierend auf beschreibenden Aufforderungen generieren. Diese Funktionalität beschleunigt Entwicklungszeiträume und verbessert die Codequalität. Im kreativen Sektor sind LLMs zu unschätzbaren Werkzeugen geworden. Sie sind hervorragend darin, Artikel zu verfassen, beim Texten für verschiedene Plattformen zu helfen, Bearbeitungsvorschläge zur Verfeinerung von Texten anzubieten und Autoren innovative Ideen und Handlungsstränge zur Verfügung zu stellen. Die vielfältigen Anwendungen von LLMs unterstreichen ihre transformative Kraft in verschiedenen Branchen und Bereichen.

Wie werden KI und LLMs denn zum Beispiel die Bildungslandschaft verändern?

Moujahid: Bildung stand immer vor der Herausforderung, Lernerfahrungen zu personalisieren, um den individuellen Bedürfnissen und Vorlieben der Studierenden gerecht zu werden. In der Vergangenheit war ein wirklich individueller Ansatz oft unerreichbar, aufgrund der hohen Kosten und Ressourcen, die involviert waren, insbesondere wenn ein hohes Verhältnis von Lehrern zu Studierenden gefordert war. Mit dem Aufkommen von KI und LLMs erfährt diese Landschaft eine transformative Veränderung.

LLMs, mit ihrem umfassenden Verständnis von Sprache, können Bildungsinhalte an den einzigartigen Lernstil jedes Schülers anpassen. Die Datenanalysefähigkeiten der KI können kontinuierlich die Beteiligung und das Verständnis der Studierenden bewerten und den Inhalt in Echtzeit anpassen, um das Lernen zu optimieren. Diese Fusion von KI und LLMs bietet eine beispiellose Möglichkeit, personalisierte Bildung zu demokratisieren, obwohl es wesentlich ist, diese Werkzeuge verantwortungsbewusst einzusetzen, um sicherzustellen, dass sie den Studierenden wirklich zugutekommen.

Und wie verändern KI und LLMs die Softwareentwicklung, insbesondere auch das Coding, und welche Auswirkungen haben sie auf Low-Code- und No-Code-Plattformen?

Moujahid: Die Welt der Softwareentwicklung drehte sich immer um Evolution, mit dem Ziel, inklusiver und zugänglicher zu sein. Mit dem Aufstieg von KI und LLMs erreicht dieses Feld neue Höhen an Einfachheit und Effizienz. Jetzt kann man, auch ohne tiefe Codierkenntnisse, robuste Anwendungen mit nur wenigen Codezeilen und der Kraft der KI erstellen. Low-Code- und No-Code-Plattformen, die einen Weg bieten, Software ohne Codierung zu bauen, profitieren hiervon immens. Durch die Integration von KI-Tools ermöglichen diese Plattformen es den Nutzern, mühelos fortgeschrittene Funktionen hinzuzufügen. Dadurch können nicht nur professionelle Entwickler, sondern auch mehr und mehr andere "Enthusiasten" und Unternehmer ihre Ideen schneller denn je in die Realität umsetzen.

Okay. Wir nehmen mit, dass KI und LLMs erhebliche Auswirkungen auf viele Sektoren und Bereiche haben werden. Aber wer wird Deiner Meinung nach am meisten von dieser Transformation profitieren?

Moujahid: Zuerst einmal die anbietenden Firmen. Technisch gesprochen befindet sich an der Basis die Hardware-Schicht, die für das Training und den Einsatz dieser Modelle unerlässlich ist. NVIDIA mit seinen fortschrittlichen GPUs führt in diesem Bereich. Ihre Dominanz spiegelt sich in ihrer Marktkapitalisierung wider, die im Juni 2023 1 Billion USD überschritt. Einen Schritt weiter oben finden wir Unternehmen, die sich auf die Entwicklung und Hosting von KI-Modellen und -Plattformen spezialisiert haben. Zu den namhaften Akteuren in dieser Kategorie gehören OpenAI und große Cloud-Service-Anbieter wie Azure, AWS und GCP.

Ihnen folgen die Softwareunternehmen. Diese Firmen integrieren aktiv KI und nutzen sie als Werkzeug, um zu innovieren und bahnbrechende Produkte und Lösungen zu schaffen. Dienstleistungsorientierte Unternehmen kommen als Nächstes. Sie spielen eine unverzichtbare Rolle, indem sie andere Unternehmen dabei unterstützen, KI-Technologien für verschiedene Anwendungen zu integrieren und zu optimieren. Dann haben wir noch die Einzelprofis, die auch KI-Tools einsetzen. Indem sie diese Technologien in ihre Arbeitsabläufe integrieren, können sie ihre Fähigkeiten erweitern und verbesserte Dienstleistungen anbieten. Schließlich profitieren die Endverbraucher von all diesen Fortschritten. Als Konsumenten erleben wir eine höhere Qualität von Produkten und Dienstleistungen, die von KI angetrieben werden.

Wer verpasst die Vorteile von KI, wer wird zurückgelassen? Und, inwieweit wird die KI menschliche Arbeitsplätze übernehmen?

Moujahid: Wie bei jedem technologischen Fortschritt wird auch der weitere Aufstieg der KI Marktturbulenzen verursachen. Wenn KI-Systeme smarter werden, werden sie Aufgaben übernehmen, die früher ausschließlich von Menschen erledigt wurden. Der Schlüssel zur Navigation in dieser Landschaft ist die Anpassungsfähigkeit. Unternehmen und Einzelpersonen, die zögern, dieses neue Paradigma zu übernehmen oder sich darauf einzustellen, könnten in der Tat zurückbleiben. Es geht aber nicht so sehr darum, dass die KI Deinen Job direkt ersetzt, sondern Personen, die KI effektiv einsetzen, behalten die Oberhand und haben das Potenzial, sich durchzusetzen. KI wird dabei aber Rollen zu übernehmen, von denen man einst dachte, dass sie strikt menschliche Domänen seien.

Angesichts der wirklich schnellen Entwicklungsgeschwindigkeit in der KI und bei LLMs, wie reagieren denn Regierungen in Bezug auf Regulierungen und welchen potenziellen Herausforderungen begegnen sie in diesem Bereich?

Moujahid: KI hat definitiv weltweit die Aufmerksamkeit der Regulierungsbehörden auf sich gezogen. Europa hat beispielsweise im Vergleich zu anderen Regionen eine strengere Haltung eingenommen. Schwerpunkte für Regulierungsbehörden sind unter anderem die Sicherstellung von Security, die Behandlung von Bias, die Wahrung von Rechenschaftspflichten, die Steigerung von Transparenz zum Beispiel bezogen auf die Datenbasis, der Schutz der Privatsphären und das Verständnis der breiteren gesellschaftlichen Auswirkungen der KI. Den richtigen Ausgleich zwischen der Förderung von Innovationen und der Berücksichtigung dieser Bedenken zu finden, ist eine heikle Aufgabe.

Eine globale Zusammenarbeit ist dabei unerlässlich; andernfalls riskiert die Welt, in ein "Gefangenendilemma"-Szenario zu geraten, in dem einzelne Nationen auf Grundlage eigener Interessen statt des kollektiven Wohls handeln. Eine große Herausforderung besteht im Aufstieg von Open-Source-KI: Während die Regulierung großer Technologieunternehmen vielleicht unkompliziert sein mag, wird die Aufsicht über unzählige kleine Entitäten oder Individuen, die KI auf privaten Servern nutzen, zu einer gewaltigen Aufgabe.

Gibt es andere Bereiche in der KI, die in den letzten Jahren ähnlich Deine Aufmerksamkeit erregt haben?

Moujahid: Für mich sind die Bereiche Gesundheitswesen und Pharmazie einige der faszinierendsten Sektoren, die eine KI-Transformation durchlaufen. Betrachte die bahnbrechende Arbeit von DeepMind: Ihr System AlphaFold kann die 3D-Struktur eines Proteins aus seiner Aminosäuresequenz ableiten, ein Sprung, der die Forschung in fast jedem Bereich der Biologie revolutionieren könnte. Zudem haben sie eine KI entwickelt, die genetische Mutationen präzise identifiziert und somit dabei hilft, den Ursprung von Krankheiten zu lokalisieren. Diese Innovationen haben das Potenzial, die Patientenversorgung erheblich zu verbessern, die Forschung zu rationalisieren und den Weg für eine effizientere medizinische Zukunft zu ebnen.

Wir kommen nun zum Ende unseres Interviews. Lass mich abschließend noch einmal eine Frage zu ChatGPT stellen: Wie denkst Du wird ein ChatGPT 5 aussehen?

Moujahid: ChatGPT ist noch relativ jung, aber der Fortschritt, den wir bisher gesehen haben, ist bemerkenswert, und ich erwarte in den kommenden Jahren noch weitere Fortschritte. Wir erleben bereits die schrittweise Einführung seiner multimodalen Fähigkeiten, die über reinen Text hinausgehen, um Bilder, Videos, Stimme und Echtzeit-Zugang zu den neuesten Internetinformationen einzubeziehen. Die Architektur wird wahrscheinlich sowohl in der Leistung als auch in der Recheneffizienz Verbesserungen sehen. Denken wir dabei z.B. auch an die Entwicklung von Google im Bereich des Web-Crawlens: von den Anfängen bis heute: es ist viel besser und effizienter geworden, und ähnlich wird ChatGPT wahrscheinlich periodische Updates erfahren, um die aktuellsten Informationen zu erfassen.

Ich sehe auch eine Verringerung der API-Preise voraus, was es für eine breitere Palette von Anwendungen zugänglicher macht. Was die zukünftigen Pläne von OpenAI angeht, könnten sie sich darauf einlassen, neue Produkte zu entwickeln. Diese könnten von branchenspezifischen Lösungen, die von GPTX angetrieben werden, bis hin zur Erkundung neuer Verbraucherprodukte reichen.

Adil, das war wieder einmal ein sehr informatives Interview. Gibt es eine Möglichkeit für interessierte Leser, direkt mit Dir in Kontakt zu treten?

Moujahid: Ja, ich habe einen persönlichen Blog, auf dem ich über Datenanalytik, KI und Blockchain schreibe; und man kann mich auch auf LinkedIn und X bzw. Twitter finden.

Sehr gut; wir fügen die entsprechenden Links an das Ende des Interviews. Vielen Dank für das Interview!

Link: Blog-Website von Adil Moujahid

Link: LinkedIn von Adil Moujahid

Link: X (ehemals Twitter) von Adil Moujahid

Link: AI Innovationen bei OYSTEC

Copyright: DALL-E 2, Midjourney, OpenAI, ChatGPT, NVIDIA, AWS, Azure, GCP, DeepMind, AlphaFold und GPTX sind Eigentum der jeweiligen Organisationen. Alle anderen erwähnten Markennamen, Website-Adressen und Warenzeichen oder Logos sind Eigentum der jeweiligen Inhaber. Dieser Artikel wurde mit KI-Technologien von Midjourney Inc., OpenAI Inc. und DeepL SE optimiert.

Adil Moujahid: Künstliche Intelligenz und das Potential generativer KI