top of page

Von A bis Z: Die wichtigsten KI-Begriffe einfach erklärt

Autorenbild: Barbara OberrauterBarbara Oberrauter

Wussten Sie, dass es bereits 1950 erste Tests zur Künstlichen Intelligenz gab und KI-Technologie heute bereits eigenständig Texte schreiben, Audio-Transkriptionen erstellen oder Kunstwerke erstellen kann? Hier werden die wichtigsten Schlüsselbegriffe und neue Phänomene künstlicher Intelligenz verständlich erklärt - von Anthropic über LLM bis zu xAI.


Adobe Express


Das Softwareunternehmen Adobe hat mit Express eine Designplattform herausgebracht, die auch von nicht professionellen Gestalter*innen für das schnelle Erstellen von Grafiken, Präsentationen, Social Media Visuals etc. verwendet werden kann. In der kostenlosen Version sind alle Funktionen mit eingeschränkter Nutzung enthalten. Seit kurzem nutzt Adobe Express auch die KI-Technologie von Firefly, zu den neuen Funktionen gehören u.a. Ein All-in-one KI-Editor für Bilder, Videos und Grafiken, Text to Template und Refine Cutout.


Anthropic


Anthropic begann 2021 als KI-Startup von ehemaligen OpenAI-Mitarbeiter*innen und ist heute einer der größten Konkurrenten des ChatGPT-Entwicklers, mit Milliarden-Investitionen von Firmen wie Google und Amazon.


Das Unternehmen hat sich auf die Entwicklung von KI-Systemen und Sprachmodellen spezialisiert, wobei ein Fokus auf dem sicheren und verantwortungsvollen Umgang mit künstlicher Intelligenz liegt. Das bekannteste Produkt von Anthropic ist der von vielen Unternehmen genutzte Chatbot Claude.


Bing


Microsofts erweitert die Suchmaschine Bing um KI-Suchfunktionen – das neue Bing wird als “KI-gesteuerter Copilot für das Internet” bezeichnet und nutzt die gleiche Technologie wie ChatGPT. Statt der Eingabe in ein Suchfeld mit darauf folgenden Webseiten-Ergebnissen stellt man Fragen oder gibt Anweisungen im Chat und kann die Ergebnisse im Chat-Verlauf verfeinern.


Im Gegensatz zu ChatGPT nutzt Bing aktuelle Informationen aus dem Internet und verlinkt die genutzten Quellen direkt, momentan kann man den Chat nur im Microsoft Browser Edge oder in der Bing Mobile App verwenden.


Canva


Das australische Softwareunternehmen Canva veröffentlichte bereits 2012 die gleichnamige kostenlose Online-Plattform für Grafikdesign. Auf Basis von einer großen Template-Bibliothek können auch Design-Einsteiger*innen ruckzuck Flyer, Animationen oder Layouts erstellen und individualisieren.


Mit Magic Studio bringt Canva nun seit kurzem verschiedene Apps mit generativer KI unter ein virtuelles Dach, Highlights sind etwa ein Text-to-Image Bildgenerator, KI-gestützte Bildbearbeitung und Magic Design für das Erstellen von KI-Layouts.


ChatGPT


Der Chatbot ChatGPT vom US-Entwickler OpenAI hat die Nutzung künstlicher Intelligenz für berufliche Zwecke und auch kreative Aufgaben salonfähig gemacht, ist aber auch immer wieder aufgrund rechtlicher Grauzonen und Fragestellungen in den Medien.


Die Abkürzung steht für Chatbot Generative Pre-trained Transformer, darin stecken schon die wichtigsten Elemente der Anwendung: Generative KI ist ein Sprachmodell (LLM), das auf Basis von riesigen Text- und Datenmengen trainiert wurde und anhand von eingegebenen Anweisungen (Prompts) im Chat menschenähnliche Texte generieren kann.


Der Informationsstand des Chatbots reicht momentan nur bis zum Jahr 2021 und beruht auf Quellen wie Wikipedia, Newsartikeln, Online-Büchern etc. Die Anwendungen von ChatGPT sind vielfach, so kann die KI lange Texte zusammenfassen oder übersetzen, verschiedenste Textinhalte und -stile wie Songtexte, akademische Arbeiten oder Socia Media Posts erstellen, aber auch Programmiercodes bauen, mathematische Formeln verwenden oder Urlaubsempfehlungen geben.


Deep Blue


Deep Blue war ein vom IT-Unternehmen IBM entwickelter Supercomputer, der auf Basis früher KI arbeitete und auf Schach spezialisiert war. Weltberühmt ist das Schachturnier zwischen Deep Blue und dem damaligen Schachweltmeister Garri Kasparov im Jahr 1997, da erstmals ein Mensch von einer Maschine in solch einem Spiel geschlagen wurde.


Deep Blue wurde zuvor durch eine frühe Form von Machine Learning in unzähligen Spielen mit Menschen auf verschiedene Szenarien trainiert, zuvor galt es dennoch als unwahrscheinlich, dass ein Computer “selbstständig” Entscheidungen treffen und dazulernen kann. Der Sieg gegen Kasparov hat auch erste Ängste und Kritik davor geschürt, dass intelligente Maschinen eines Tages den Menschen ersetzen werden.


Claude


Der Chatbot Claude wurde im März 2023 vom OpenAI-Konkurrenten Anthropic auf den Markt gebracht und hat seitdem bereits eine zweite Version bekommen, die kostenlos zur Verfügung steht.


Grundsätzlich funktioniert er wie andere Chatbots durch die Eingabe von Prompts im Gesprächsverlauf, laut Nutzerberichten und Marketing simuliert Claude im Vergleich zu ChatGPT oder Google Bard aber einen freundlichen, natürlicheren Gesprächsverlauf und kann komplexe Dialoge führen oder auch kreativ denken.


Die Trainingsdaten von Claude werden mittels eines eigens entwickelten Sprachmodells regelmäßig aktualisiert, darüber hinaus hat Anthropic mit der “Constitutional AI” oder KI-Verfassung ethische und gesetzliche Prinzipien für das Training und die Nutzung des Bots formuliert.


Dall-E


Dall-E ist momentan der marktführende KI-Bildgenerator und wurde von OpenAI 2021 vorgestellt, seit Herbst 2023 ist die dritte Version Dall-E 3 in den Pro- und Businessmodellen von OpenAI nutzbar.


Der Text-zu-Bild Generator funktioniert ähnlich wie ChatGPT und nutzt Deep-Learning-Modelle zusammen mit GPT-3, um sprachliche Benutzeranweisungen zu verstehen und daraus neue, einzigartige Bilder zu generieren. Bildkompositionen können in 2-D oder 3-D und jeglicher Stilrichtung kreiert werden, die Ergebnisse sind ebenso kommerziell nutzbar. In den Medien wird Dall-E häufig im Zusammenhang mit Urheberrechtsdebatten oder Kunstkritik diskutiert.


Digitales Kompetenzmodell für Österreich / Digital Skills Barometer


Das Digitale Kompetenzmodell für Österreich - DigComp AT wurde vom Europäischen Referenzrahmen für digitale Kompetenzen abgeleitet und soll dabei helfen, digitale Fähigkeiten und Wissensstufen einzuordnen und vergleichbar zu machen. Die aktuelle Fassung des Modells beschreibt sechs Kompetenzbereiche von Grundlagen und digitaler Kommunikation bis zur sicheren Ressourcennutzung und innovativer Problemlösung.


Ergänzend dazu hat die Studie “Digital Skills Barometer” im Jahr 2022 4.000 Teilnehmer*innen in Österreich zu ihren digitalen Kompetenzen befragt. Im Durchschnitt erreichten die Österreicher*innen bei den Wissensfragen zwischen 40,8% und 43,3% (Kompetenzstufe 2). Je höher der Bildungsabschluss, umso höher fällt die “digitale Fitness” aus und bei der digitalen Kompetenz zeigt sich auch ein Gender Gap, der Frauen benachteiligt.


EU AI Act / Artificial Intelligence Mission Austria 2030


Die österreichische Strategie "Artificial Intelligence Mission Austria 2030" (AIM AT 2030) beruht auf dem 2018 von der Europäischen Kommission entwickelten Fahrplan für künstliche Intelligenz. Die umfassende Strategie zielt darauf ab, das Potenzial von KI für Österreichs Zukunft zu nutzen und gleichzeitig sicherzustellen, dass sie verantwortungsvoll, gesetzlich gesichert und ethisch korrekt eingesetzt wird.


2021 hat die EU einen ersten EU-Rechtsrahmen für KI vorgeschlagen, der es ermöglicht, KI-Systeme je nach Risiko, das sie für Nutzer*innen darstellen, zu analysieren, einzustufen und letztlich zu regulieren. Damit sollen gesetzliche, ethische und moralische Grauzonen bezüglich Urheberrecht, Datenschutzrecht, der beruflichen Verwendung von KI etc. geklärt werden. Der EU AI Act soll 2024 offiziell in Kraft treten.


Firefly


Der Software-Gigant Adobe entwickelt schon seit mehr als zehn Jahren KI-Lösungen, mit Adobe Firefly existiert seit Anfang 2023 auch eine eigene Bildsoftware mit generativer KI. Firefly funktioniert im Grunde ähnlich wie die Vorreiter Dall-E oder Stable Diffusion, der Clou ist aber, dass der Dienst in anderen Adobe-Programmen wie Photoshop, Illustrator und Express integriert wird.


So ist Text-zu-Bild-Kreation und individuell angepasste Bildbearbeitung auf hohem professionellem, aber auch Anfänger-Niveau möglich. Im Unterschied zu anderen Bild-KIs greift Adobe beim Training des Programms auf eigene Stock-Galerien zu und überprüft mögliche Fälschungen oder Copyright-Verstöße genau.


Google Bard


Google Bard ist ein KI-Chatbot, der auf Googles Language Model for Dialogue Applications (LaMDA) basiert und 2023 als kostenloser, aber noch experimenteller Dienst veröffentlicht wurde. Ähnlich wie ChatGPT und Bing Chat bietet Bard ein interaktives Konversationserlebnis, dabei wird auf aktuelle Internetseiten und Datenbanken zurückgegriffen. Darüber hinaus kann Bard als generative KI auch originelle Inhalte erstellen, in Zukunft soll der Bot eigenständige Videos und Bilder generieren können.


GPT


GPT oder Generative Pre-trained Transformer bezeichnet ein System künstlicher Intelligenz, das von OpenAI entwickelt und 2018 erstmals präsentiert wurde. Die KI-Forschung und ML-Entwicklung hat mithilfe von GPT großen Auftrieb bekommen – die hauseigenen Anwendungen ChatGPT und Dall-E funktionierten auf Basis dieser Technologie und auch Unternehmen wie Microsoft oder Slack nutzen das Modell.


Das System funktioniert durch Deep Learning, eine Variante von maschinellem Lernen, und hat zum Ziel, künstliche neuronale Netzwerke zu simulieren, wie sie im menschlichen Nervensystem existieren. So hat GPT etwa anhand eines großen Textkorpus mit Inhalten und Stilen von Kunst bis Wissenschaft gelernt, wie menschliche Sprache funktioniert.


GPT-Modelle können heute menschenähnlicher Texte schreiben und übersetzen, Aufgaben erledigen und automatisieren, sogar Bilder und Musik interpretieren und erstellen. Die neueste Version GPT-4 soll sogar kontextbezogene und mehrdeutige Stilmittel wie Humor oder Sarkasmus erkennen.


Künstliche Intelligenz / KI


Die Abkürzung KI, aus dem Englischen AI (artificial intelligence), steht für Künstliche Intelligenz und fasst als Überbegriff einen Bereich der IT zusammen, der zum Ziel hat, Computern menschliche Denkfähigkeit beizubringen. Der Begriff Artificial Intelligence wurde erstmals 1956 während einer Konferenz der US-amerikanischen Universität Dartmouth geprägt.


KI-Systeme nutzen Daten und Algorithmen, um Muster zu erkennen, Entscheidungen zu treffen, Probleme zu lösen und Informationen zu verstehen – dies geschieht etwa durch Maschinelles Lernen, bei dem große Datenmengen analysiert und auf Muster überprüft werden. Das Besondere an KI-Technologien ist, dass die Systeme eigenständig dazulernen und anpassungsfähig sind, im Gegensatz zu starren, binären Rechenprozessen arbeitet KI auch mit Wahrscheinlichkeiten.


Künstliche Intelligenz ist als Forschungsfeld und Basis für kommerzielle Anwendungen in den letzten Jahren förmlich explodiert, zu den vielen Anwendungsgebieten gehören Medizin, Robotik, die Automobilindustrie, virtuelle Assistenten, Marketing und Vertrieb, jüngst auch Literatur und Kunst. Gleichzeitig werfen KI-Anwendungen aufgrund fehlender Transparenz und gesetzlicher Lücken ethische und gesellschaftliche Fragen auf.


LLM


Large Language Models oder LLM sind leistungsstarke KI-Modelle, die auf Basis riesiger Mengen von Daten und Texten trainiert werden, um natürliche sprachliche Muster und Zusammenhänge zu erkennen.


Durch selbstüberwachtes Lernen wird trainiert, Abfolgen von Tokens (Text- oder Codeeinheit) je nach Zweck und Kontext der Aussage, vorherzusagen – lesen oder schreiben funktioniert daher wie ein Aneinanderreihen verschiedener Möglichkeiten.


Dies wird so oft wiederholt, bis eine präzise Lösung herauskommt. LLM ist die Basis für viele Anwendungen wie Chatbots (ChatGPT), Suchmaschinen oder auch die Automatisierung von repetitiven Aufgaben im Unternehmenssoftware.


Machine Learning


Maschinelles Lernen (ML) ist eine Form von künstlicher Intelligenz, die Computern ermöglicht, automatisierte Analysen durchzuführen, sich laufend an neue Szenarien anzupassen und eigenständig Problemlösungen zu entwickeln, auf die sie nicht spezifisch programmiert wurden.


Das passiert durch Algorithmen, die mit großen Datensätzen gefüttert werden, um darin Muster und Zusammenhänge zu erkennen – auf Basis dieser werden Vorhersagen und folglich Entscheidungen getroffen. Je größer der Datensatz und je öfter das System trainiert wird, umso präziser fallen die Ergebnisse aus.


Midjourney


Midjourney ist ein KI-Bildgenerator, der nach dem gleichen Prinzip wie Dall-E oder Stable Diffusion funktioniert, sich aber vorwiegend an Technologie-affine Nutzer*innen wie Entwickler*innen, Gamer*innen oder digitale Designer ausrichtet.


Die 2022 vom gleichnamigen Forschungsinstitut veröffentlichte Anwendung befindet sich noch im Beta-Stadium und ist über die Chat-Plattform Discord kostenlos verfügbar. In der Öffentlichkeit kam Midjourney durch ein täuschend echtes Bild von Papst Franziskus in einem weißen Hip-Hop-Puffermantel in die Schlagzeilen. Seither gilt das Programm als KI-Generator, der mit höchster ästhetischer und künstlerischer Qualität punktet.


OpenAI


Das US-amerikanische Unternehmen OpenAI wurde 2015 u.a. von bekannten IT-Größen wie Sam Altman und Elon Musk begründet, um künstliche Intelligenz zu erforschen, zu entwickeln und in Form von Open Source Lösungen der Gesellschaft zur Verfügung zu stellen.


OpenAI steht hinter Technologien und KI-Modellen wie GPT, Dall-E und CLIP, mittlerweile werden die Dienste auch kommerzialisiert – zu den größten Geschäftspartnern gehört etwa Microsoft.


Die Errungenschaften des KI-Entwicklers haben die Forschung und die öffentliche Nutzung von künstlicher Intelligenz massiv vorangetrieben; das Unternehmen steht aber auch unter Kritik, da Trainingsdaten und Funktionsweisen der KI nicht offengelegt werden und es zu Daten- bzw. Urheberschutzrechtlichen Problemen kommt.


Perplexity


Die KI-gestützte Suchmaschine Perplexity AI basiert auf der Open-AI GPT-3 und LLM, obwohl der unabhängige Dienst erst Ende 2022 das Licht des Internets erblickt hat, gilt er als ernstzunehmende Konkurrenz zu ChatGPT, Bing Chat oder Google.


Der Dienst kann kostenlos und ohne Registrierung auf der Webseite verwendet werden und bietet eine Kombination aus Websuche und Chatbot an. Die Suchergebnisse aus dem Internet werden kompakt zusammengefasst, die Quellen sind als verlinkte Fußnoten ersichtlich, zudem reagiert Perplexity auf den Kontext der Fragen mit Einschätzungen und weiteren Vorschlägen.


Poe


Ein KI-Chatbot, der KI-Chatbots erstellt? – Poe (kurz für: Platform for Open Exploration) macht es möglich. Das kostenlose Produkt der FAQ-Plattform Quora wurde Anfang 2023 als intelligenter Chatbot für Fragen aller Art publiziert, die neueste Funktion ist, selbst neue Chatbots durch Prompts zu kreieren.


Dafür nutzt Poe direkt die Dienste von ChatGPT und Claude, nach dem Erstellen ist der Bot über eine eigene URL abrufbar. Bisher sind so etwa Chatbots entstanden, die Nachrichten in Emojis verwandeln, zur Reiseplanung dienen oder Flirt-Gespräche simulieren.


Prompt Engineering


Der Begriff Prompt bedeutet ursprünglich Aufforderung und ist im Zusammenhang mit KI-Modellen zum geflügelten Wort geworden. Um von KI-Anwendungen wie ChatGPT, Dall-E oder Midjourney präzise Ergebnisse zu bekommen, ist es notwendig, Aufforderungstexte oder Fragen so klar und präzise zu formulieren, dass sie vom Programm richtig interpretiert werden können.


Die richtige “Formel” ist je nach KI-Modell oder Anwendung unterschiedlich und erfordert Logik, Experimentierfreude, Geduld wie auch Kreativität. Mittlerweile werden sogar Workshops und Kurse für Prompt Engineering angeboten, für den privaten oder professionellen Gebrauch.


RLHF


Das Akronym RLHF steht für Reinforcement Learning from Human Feedback oder „Bestärkendes Lernen aus menschlicher Rückmeldung“. Beim bestärkenden Lernen wird ein “Agent” (Algorithmus, Programm etc.) trainiert, wie er sich in einer bestimmten Umgebung (z.B. Computerspiel) verhalten soll, indem er auf verschiedene Aktionen eine Belohnung oder Bestrafung erhält.


Durch diesen Trial-and-Error-Prozess lernt die Maschine, komplexe Probleme zu lösen. RLHF ist eine weitere Variante dieser Methode des maschinellen Lernens, bei der der Agent direkt Feedback von Menschen (Expert*innen) erhält. Dies ist besonders wertvoll für Bereiche, die von der KI selbst schwer beurteilt werden können, wie Humor oder ethisch-moralische Grauzonen.


Roboter


Roboter sind Maschinen, die dem Menschen (physische, kommunikative etc.) Arbeit abnehmen sollen. Mithilfe von künstlicher Intelligenz werden Roboter immer autonomer und lernfähiger, durch maschinelles Lernen werden etwa selbstständig komplexe Probleme gelöst, anhand von Sensoren können die Maschinen sensibel mit der physischen Welt interagieren. Die KI-Forschung fokussiert momentan u.a. auf Roboter im Gesundheitswesen, der Weltraumforschung und in der Industrie, etwa im Rahmen von autonomen Fahrzeugen.


Siri


Die virtuelle Sprachassistenz-Software Siri (Speech Interpretation and Recognition Interface) von Apple sorgte 2011 erstmals für Furore mit der Fähigkeit, im “mündlichen Gespräch” mit Nutzer*innen Aktionen wie Terminplanung, Internet-Recherche oder Verkehrsnavigation auszuführen.


Siri stützt sich hierbei auf KI-Technologien zur Spracherkennung, natürliche Sprachverarbeitung (NLP) und Maschinelles Lernen zum Erkennen der Nutzer*innen-Vorlieben. Im Vergleich zu Vorreitern generativer KI ist Apple bisher wenig aktiv, Branchen-Insider erwarten in der nahen Zukunft eine verbesserte Siri-Version mit visueller Intelligenz und multimodaler KI.


Stable Diffusion


Der KI-Bildgenerator Stable Diffusion gilt als einer der Hauptkonkurrenten zu Dall-E und wurde u.a. der Universität München (LMU), dem Start-up Stability.ai sowie der deutschen Non-Profit-Organisation LAION entwickelt.


Im Gegensatz zu den bekannten Bild-KI-Modellen ist Stable Diffusion als Open Source Software frei zugänglich, darüber hinaus legt der Hersteller alle Bildquellen, mit denen die KI trainiert wurde, offen. Das KI-Modell verwendet Deep Learning und generiert Bilder anhand von Text-Prompts.


Token


Große Sprachmodelle (LLM) zerlegen Sprache in Einheiten, die Token genannt werden und aus Wörtern, Satzzeichen oder Silben bestehen können. Durch umfangreiches Trainingsläufe lernen LLM Beziehungen und Kontexte zwischen Token, ähnlich wie beim Erlernen menschlicher Sprache – dabei erkennen die KI-Systeme aber nicht die Bedeutung der Elemente, sondern weisen ihnen eine Zahlen-ID zu.


Bei der Verarbeitung einer Anfrage zerlegen LLM diese in Token und generieren Antworten Token für Token auf der Grundlage von Wahrscheinlichkeiten. Das Wort “Katze” hat zum Beispiel den gleichen Bedeutungsraum wie “Mieze” und wird eher mit dem Token “die” als “das” oder eher mit “miaut” als “bellt” verwendet.


Dieser Prozess wird auch Autoregression genannt, da er bei jeder Prompt-Eingabe wieder neu berechnet wird, gleicht kein Ergebnis dem anderen und bei Chatbots wie ChatGPT kann es manchmal zu unlogischen oder nicht originellen Antworten kommen.


Turingtest


Der Turing-Test wurde vom britischen Mathematiker und Informatiker Alan Turing im Jahr 1950 entwickelt und stellt einen ersten Meilenstein in der Forschung von künstlicher Intelligenz und Computertechnologie dar.


Im Zentrum steht die Frage, ob eine Maschine ein gleichwertiges Denkvermögen wie ein Mensch an den Tag legen kann. Dafür chattet ein Mensch via Computer mit zwei anonymen Gesprächsteilnehmern – einer ist ein Mensch, der andere eine Maschine. Kann die prüfende Person nach der Kommunikation nicht sicher feststellen, welcher der beiden die Maschine ist, wurde der Turing-Test vom intelligenten Computer bestanden.


Whisper


Im Herbst 2022 brachte OpenAI Whisper heraus, ein Spracherkennungssystem, das Audioaufnahmen analysiert und in Text umwandelt. Das KI-System unterscheidet sich in ein paar Punkten von üblichen Transkriptionsprogrammen, es verfügt etwa über einen weit größeren Trainingssatz (680.000 Stunden Audiomaterial) und beherrscht über 100 Sprachen.


Whisper wird durch Deep Learning trainiert und basiert auf der Transformer-Architektur, die in OpenAI-Modellen wie GPT-3 zum Einsatz kommt. Das Programm wird als Open Source für Programmierer*innen bereitgestellt und benötigt zur Einrichtung daher auch Wissen zur Softwareentwicklung (Programmiersprache Python3.7).


x AI


Das Unternehmen xAI wurde im März 2023 von KI-Unternehmer Elon Musk (Tesla, Twitter, SpaceX) gegründet, mit dem Vorhaben “die wahre Natur des Universums“ verstehen. Musk war einer der Begründer von OpenAI, bezeichnete die Arbeit des Unternehmens später aber als gefährlich, da etwa freie Rede reguliert wird und Datensicherheit nicht gewährt ist.


Mit xAI will er OpenAI und Deepmind (Google) eine marktführende KI entgegensetzen, die die großen Probleme der Menschheit, wie etwa die Klimakrise, lösen soll. Wie genau und wann dies geschehen soll, wurde aber noch nicht näher erklärt.


bottom of page