top of page

Was kann Künstliche Intelligenz?

Einfach Erklärt

Nachdem wir nun ein Grundverständnis davon haben, wie Künstliche Intelligenz (KI) funktioniert, können wir uns überlegen, welche Möglichkeiten sie bietet. Der Fortschritt in diesem Bereich ist beeindruckend. Jede Woche gibt es neue Entwicklungen, die KI-Systeme weiter verbessern.

Bevor wir uns spezielle Anwendungsfälle anschauen, klären wir einige wichtige Begriffe:

  • AI (Artificial Intelligence): Das ist der englische Ausdruck für Künstliche Intelligenz (KI).

  • LLM (Large Language Model): Ein LLM-Modell kann Texte verarbeiten und generieren. Sein Ziel ist es, menschliche Sprache nachzuahmen.

  • AI-Model (KI-Model): Das bezeichnet eine spezifische KI, die bestimmte Aufgaben erfüllen kann. Zum Beispiel basiert chatGPT auf dem Modell GPT-4, welches auch ein LLM ist.

  • Multimodal-Model: Ein solches Modell kann verschiedene Arten von Daten, wie Texte und Bilder, verarbeiten.

  • Fine-Tuning: Das ist eine Methode, um ein Modell speziell auf bestimmte Aufgaben zu trainieren. Dabei werden dem Modell nach seiner Grundausbildung spezifische Daten dieser Aufgaben zugeführt.

Mit diesen Begriffen im Hinterkopf können wir uns nun verschiedene KI-Modelle und ihre Fähigkeiten genauer ansehen.

Chatten und KI-Modelle

Ein herausragendes Beispiel für Chat-Technologie ist chatGPT von OpenAI. Das aktuelle Modell, GPT-4, gilt als das fortschrittlichste auf dem Markt (Stand: Oktober 2023). Doch die Entwicklung dieses Systems war ein Prozess über mehrere Generationen.

Die unterschiedlichen GPT-Modelle variieren in Größe und Fähigkeiten. Ein wichtiger Begriff dabei ist "Parameter". Ein Parameter kann als Analogie zu einem Neuron im Gehirn gesehen werden, einer Verbindungseinheit.

Vergleich der GPT-Modelle:

GPT-1 (2018)

  • Parameter: 120 Millionen

  • Fähigkeiten: Fragenverständnis, Satzvervollständigung, einfache Übersetzungen

  • Limitationen: Oft inkorrekte oder unsinnige Antworten, begrenztes Wissen

GPT-2 (2019)

  • Parameter: 1,5 Milliarden

  • Fähigkeiten: Verbessertes Fragenverständnis, qualitativ hochwertige Übersetzungen, Textzusammenfassungen, grundlegendes Textverständnis, einfache Arithmetik

  • Limitationen: Kann irreführende Informationen liefern, begrenztes Wissen

GPT-3 (2020)

  • Parameter: 175 Milliarden

  • Fähigkeiten: Erstellen von E-Mails, Tutoring, fortgeschrittene Übersetzungen, Verfassen von Essays und Gedichten, einfache Code-Generierung

  • Limitationen: Fehlendes echtes Inhaltverständnis, manchmal Übergeneralisierungen

GPT-3.5 (2022)

  • Parameter: 175 Milliarden

  • Dieses Modell nutzt die gleichen Daten wie GPT-3, jedoch mit verbesserten Systemen und Werten, um die Fähigkeiten weiter zu optimieren.

GPT-4 (2023)

  • Parameter: Unbestätigt, jedoch deuten Leaks auf 8 Modelle mit je 220 Milliarden Parametern hin – insgesamt etwa 1,75 Billionen.

  • Fähigkeiten: Imitation von Persönlichkeiten, tiefes Verständnis komplexer Themen, Erzeugung diverser Textarten, menschenähnliche Antworten, nahezu perfekte Übersetzungen

  • Limitationen: Wissensstand bis September 2021, begrenzter Kontext

Wie der Vergleich zeigt, hat sich in wenigen Jahren viel entwickelt. Mit mehr Daten wurden die Modelle immer präziser und konnten komplexere Zusammenhänge erfassen.

Ein faszinierender Aspekt ist, dass die Modelle plötzlich neue Fähigkeiten entwickeln können. Beispielsweise konnte das Modell LambDa nach einer geringfügigen Datenzunahme plötzlich fließend Persisch, obwohl sich am Training kaum etwas geändert hatte.

Ein Screenshot aus dem Paper 'Emergent Abilities of Large Language Models' worauf zu sehen ist wie ein Model auf einmal erlent Persisch zu sprechen

Ein weiteres Beispiel von LambDa zeigt, dass es sehr schlecht war Wörter zu entwirren. Das heißt wenn man einem kleinen Model die Zeichenfolge 'nhud' gibt, kann es nicht 'Hund' daraus machen. Gibt man ihm jedoch nur ein paar mehr Daten, hat es diese Fähigkeit wie aus magischer Hand erlernt

Ein Screenshot aus dem Paper 'Emergent Abilities of Large Language Models' worauf zu sehen ist wie ein Model auf einmal erlent Buchstaben in Wörter zu ändern

Nicht nur die Daten können Fähigkeiten hervorrufen, auch das ändern der Arbeitsweise mit der KI kann auf einmal magische Ergebnisse liefern. 

Als Beispiel: Man hat einem Model eine Matheaufgabe gegeben - Diese konnte sie nicht lösen.

Sagt man jedoch dem Model dass es Schritt für Schritt arbeiten soll, dann kommen auf einmal die Richtigen Ergebnisse.

In diesem Beispiel ist Grau die normale Aufgabenstellung und Blau ist das gleiche nur dass man der KI sagt es soll Schritt für Schritt arbeiten.

Ein Screenshot aus dem Paper 'Emergent Abilities of Large Language Models' worauf zu sehen ist wie ein Model besser Matheaufgaben lösen kann wenn es Schritt für Schritt und mit dem Konzept von Chain of Thoughts arbeitet

Gut, wir haben jetzt gesehen, dass die Technologie so gut wie alles lernen kann. Künstliche Intelligenzen haben die Möglichkeit das gesamte Wissen der Menschheit zu nehmen und damit zu arbeiten. Nicht nur das, sie verstehen auch Aufgaben und logische Zusammenhänge. Stellen Sie sich vor es werden nicht 1.7 Billionen Daten gefüttert sondern 1000 Trillionen. Was können diese Maschinen dann Leisten?

Hier ist noch ein Vergleich zum erstellen von Bildern. 

Links sehen wir ein Bild von Midjourney 2022 und rechts ein Bild von 2023.

Die Aufgabe war die Selbe: 'Erstelle ein Bild von Donald Trump und Barack Obama beim Basketball spielen'

2 Bilder die von Midjourney mit dem Prompt 'Erstelle ein Bild von Donald Trump und Barack obama beim Basketball spielen' generiert wurden. Das erste Bild aus 2022 ist ziemlich schlecht, worauf das zweite Bild aus 2023 sehr gelungen ist

Diese Fähigkeit stellt unsere Gesellschaft vor große Herausforderungen. Was ist echt? Was ist KI generiert?

Hier noch ein Beispiel von einem Deepfake. Das linke Video ist Orginal und das rechte Bild wurde von KI erstellt. Merkt jemand den Unterschied?

Das gleiche gilt für Sprache. Mittlerweile reichen ein paar Sekunden Aufnahme eines Menschen aus, um dessen Sprache für andere Texte zu nutzen. Hier ist ein Beispiel von Joe Bidens Stimme, welches von einem sehr kleinen Model genutzt wurde. Die großen sind fast unverkennbar.

Das ist jedoch nur der Anfang, im nächsten Artikeln erklären wir wie KI die Welt verändern könnte.

 

bottom of page