GenAI für Full Stack EntwicklerInnen: Sprachverständnis als User Interface (Teil 4)

18.7.2024 | 12 Minuten Lesezeit

Ein gutes User Interface zu designen und umzusetzen, ist schwierig. Wir als Full Stack EntwicklerInnen wissen nur zu gut, dass der Teufel im Detail steckt. Einmal ist die Animation schlecht getimed, ein Input schiebt sich über den nächsten, ein Bild will einfach nicht in der richtigen Auflösung angezeigt werden und, und, und... Passt dann der erste Entwurf, kommen mal so nebenbei noch Responsive Webdesign, Accessibility oder sogar Native Apps hinzu. Als ich das erste Mal mit ChatGPT gearbeitet habe, ist mir sofort aufgefallen, dass deren Interface denkbar einfach gestaltet ist: ein Texteingabefeld, ein bisschen Dialogdarstellung und viel mehr ist da eigentlich nicht. Ein einfaches UI für ein mächtiges Tooling.

Doch in der realen Welt sind nun mal nicht alle Anwendungen Chatbots. Daher stelle ich mir die Frage: Können wir das Interface der Sprache vielleicht auch nutzen, um die Komplexität unserer Anwendung vor den Nutzern zu verstecken? Denn LLMs sind letztendlich nichts anderes, als ein Sprachinterface. Lassen sich damit einfachere Interfaces für höhere Barrierefreiheit erstellen?

Im Folgenden beschreibe ich, wie generative KI-Modelle auch für mehr als Chat-ähnliche Anwendungen verwendet werden können. Wie aus komplizierten Eingabemasken mit Schiebereglern, Textfeldern und Kalenderauswahlen ein einfaches Textfeld wird, um Nutzern jeder Sprache und Vorerfahrung die Nutzung zu vereinfachen. Um das zu bewerkstelligen, werden wir die Technik des Function Callings nutzen. Wie gewohnt implementieren wir von der Backend-Logik bis zum Frontend alles in TypeScript. Vielleicht wirst auch du nach dem Lesen ein paar Ideen für vereinfachte Interfaces haben, mir gehen diese seither nicht mehr aus dem Kopf!

Das Szenario

Einmal angenommen, du bist ein fleißiger Full Stacker. Du stehst jeden Tag um 8 Uhr auf, setzt dich an deinen Schreibtisch und bearbeitest schon mal die ersten Mails. Nach einer halben Stunde gibt es den ersten Kaffee, dann um 10:30 vielleicht eine zweite kleine Pause, bevor dann um 12 Uhr Mittag ist. Am Nachmittag musst du nochmal kurz zum Friseur und am Abend stehst du dann vor dem üblichen Dilemma: Hast du heute schon deinen Teil zum Bruttosozialprodukt beigetragen oder fehlt noch eine Stunde? Um das herauszufinden, möchtest du nun ein Tool bauen, das dir das Eintragen der Arbeitszeit erleichtert. Doch wie ätzend ist es, jede einzelne Arbeitsphase und jede Pause manuell einzutragen? Du denkst über die Texteingaben nach, machst es vielleicht mit Excel oder Jira, aber so richtig intuitiv fühlt es sich nicht an.

Unser Ziel heute ist, statt dieser traditionellen Mischung aus Buttons, Zahlen- und Texteingaben nur noch ein Textfeld anzuzeigen, in das man dann eine Beschreibung des Arbeitstags eingibt. Das LLM wird dann auf „magische“ Weise in der Lage sein, die Eingaben zu verarbeiten und zuverlässig (das ist hier das wichtige Stichwort) unsere „aufwendige“ Arbeitszeitberechnung zu starten.

Was ist Function Calling?

Zugegeben, würde man dasselbe heutzutage einfach mit ChatGPT machen, käme wahrscheinlich meistens das gleiche Ergebnis dabei heraus. Doch das große Problem dabei ist, dass diese Antworten unvorhersehbar wären.

Die Antwort von ChatGPT ist zwar gut aber leider unvorhersehbar

Man könnte dann versuchen, die Ausgabe mit Prompt Engineering zu kontrollieren, dem Modell zum Beispiel mitteilen, immer im gleichen Format zu antworten, doch auch das würde nur bei vielleicht 80 % der Fälle zum Erfolg führen.

Diese Problematik haben auch die Hersteller der LLMs verstanden und uns mit Function Calling ein Werkzeug an die Hand gegeben, um zuverlässigere Ausgaben mit vorgegebenem Schema zu erhalten. Im Prinzip funktioniert die Technik wie folgt:

Wir definieren ein Set an Werkzeugen, die das LLM nutzen kann.
Wir teilen dem LLM mit jeder unserer Anfragen mit, welche Werkzeuge es gibt und wie diese zu nutzen sind.
Das LLM bekommt eine Aufgabe in Textform und entscheidet selbstständig, welches Tool am besten geeignet wäre, die Aufgabe zu bewerkstelligen. Es antwortet in einem vorgegebenen Textformat, das sich dann von uns interpretieren lässt.
Mit der Antwort des Modells können wir nun unsere implementierten Funktionalitäten mit den vom Modell vorgeschlagenen Parametern ausführen.
Optional: Die Antworten unserer Funktionen werden zurück an das LLM geschickt, damit dieses dann die initiale Fragestellung final beantworten kann. Diesen Schritt lassen wir für dieses Mal allerdings explizit aus, wir brauchen ihn nicht für unsere Anwendung.

Projekt Setup

Wenn du dem Artikel auch in deiner IDE folgen willst, kannst du einfach das Referenzprojekt von GitHub clonen. Ganz ähnlich wie im zweiten Artikel zum Thema RAG nutzen wir LangChain und backroad als einfaches Chat-Interface. Zur Definition des Schemas unseres Werkzeugs nutzen wir das kleine Tool zod. Installieren kannst du diese zum Beispiel mit yarn:

1yarn add @langchain/core @langchain/openai @backroad/backroad zod

Auch dieses Mal werden wir wieder eine Azure OpenAI Instanz nutzen. Denn leider unterstützen nicht alle LLMs Function Calling und ich habe die Erfahrung gemacht, dass gerade unsere lokalen Winzlinge ein wenig Probleme damit haben, zuverlässig die gegebenen Werkzeuge zu nutzen. Wie du das aufsetzt, habe ich im letzten Artikel dieser Serie erklärt.

Der Code

Im Prinzip hat unsere Anwendung drei Komponenten. Es gibt einerseits die Interaktion mit dem LLM. Das ist der wahrscheinlich interessanteste Teil, denn hier wird das Werkzeug definiert und Antworten interpretiert. Daneben gibt es das UI mit backroad und unsere "fancy" Rechenlogik, um auf Basis von Stunden und Pausen die tatsächliche Arbeitszeit zu berechnen. Letztere werde ich nur exemplarisch anreißen, denn das Zahlengeschubse ist wirklich einfachste Mathematik und für diese Serie eher irrelevant. Falls es dich näher interessiert, findest du alles auf GitHub.

Das Werkzeug

Zuerst müssen wir uns ein Werkzeug überlegen, welches alle Parameter enthält, die wir benötigen. Der Ansatz ist, den Start und das Ende der Arbeitszeit anzugeben. Zusätzlich benötigen wir noch die gemachten Pausen mit Start- und Endzeit. Als LangChain Tool sieht das so aus:

1import { DynamicStructuredTool } from "@langchain/core/tools"  
2import { z } from "zod"
3
4const workdayTool = new DynamicStructuredTool({  
5  name: "workDay",  
6  description:  "Returns start and end time of a work day. Only use once per day.",  
7  schema: z.object({  
8    start: z.string().describe("The start time when the work day started"),  
9    end: z.string().describe("The time when the work day ended"),  
10    breaks: z  
11      .array(  
12        z.object({  
13          start: z.string().describe("The start time of the break"),  
14          end: z.string().describe("The end time of the break"),  
15        }),  
16      ).describe("The breaks that were taken during the work day"),  
17  }),  
18  func: async () => "",  
19})

Jedes Werkzeug und jeder definierte Parameter benötigt einen Beschreibungstext. Dieser ist besonders wichtig, denn anhand dessen muss das Modell entscheiden, ob das Werkzeug und der Parameter genutzt wird. Ich habe das in Englisch definiert, um noch ein wenig bessere Ergebnisse zu erzielen, denn die meisten der bekannten Modelle sind etwas besser im Englischen.

Die Parameter start und end sind jeweils Strings. Meine Idee dabei ist, das für Zeiten übliche Format HH:MM zu nutzen, das sich später auch einfach in ein JavaScript Date-Objekt umwandeln lässt. Ein Beispielaufruf dieses Tools sähe dann so aus:

1{  
2  name: "workDay",  
3  args: {  
4    start: "8:05",  
5    end: "16:00",  
6    breaks: [  
7      { start: "11:05", end: "11:35" },  
8      { start: "13:00", end: "14:00" },  
9    ],  
10  },  
11  id: "1",  
12}

Der Name des Tools, hier workDay, wird als erstes genannt. Im Feld args nutzt das LLM dann unser vorgegebenes Schema. Jede Antwort bekommt auch eine eindeutige ID, mithilfe derer sich mehrere parallele Aufrufe wiederfinden lassen.

Function Calling Prompt mit Beispiel

Um die Zuverlässigkeit der Ausgabe eines LLMs zu erhöhen, können Beispiele helfen. Das gilt einerseits für traditionelles Prompt Engineering und gleichzeitig eben auch für Function Calling. Wir tun einfach so, als wäre unsere Anfrage nicht die erste im Chatverlauf gewesen. Das motiviert das Modell später, sich ähnlich zu verhalten wie in unserem Beispiel.

1import { AIMessage, HumanMessage, SystemMessage, ToolMessage} from "@langchain/core/messages" 
2
3const promptWithExample = [  
4  new SystemMessage(  
5    `Deine Aufgabe ist es, die Arbeitszeit zu berechnen. Nutze die Tools für die Berechnung.`,  
6  ),  
7  new HumanMessage(  
8    "Ich habe um fünf nach 8 gestartet und dann 3 Stunden gearbeitet. Nach einer halben Stunde Pause habe ich nochmal geschuftet. Um 13 Uhr hatte ich eine Stunde Mittagspause nur um dann nochmal 2h ranzuglotzen.",  
9  ),  
10  new AIMessage({  
11    content: "",  
12    tool_calls: [  
13      {  
14        name: "workDay",  
15        args: {  
16          start: "8:05",  
17          end: "16:00",  
18          breaks: [  
19            { start: "11:05", end: "11:35" },  
20            { start: "13:00", end: "14:00" },  
21          ],  
22        },  
23        id: "1",  
24      },  
25    ],  
26  }),  
27  new ToolMessage({  
28    tool_call_id: "1",  
29    content: "",  
30  }),  
31  new AIMessage({  
32    content: `Done`,  
33  }),  
34]

Das Beispiel hat alles, was man sich wünscht. Es enthält Start- und Endzeit und zwei Pausen. Die simulierte Antwort des Modells enthält keinen content wie üblich, sondern stattdessen im tool_calls-Feld einen Eintrag, der uns dazu auffordert, das Werkzeug workDay aufzurufen.

Da die LangChain Implementierung des Function Callings vorsieht, dass zwingend die Antwort des Tools zurück an das Modell geschickt wird, müssen wir für einen vollständigen Beispiel-Call so tun, als wäre das geschehen. Anderenfalls lässt die Bibliothek nicht zu, erneut die KI anzufragen. Da uns jedoch völlig egal ist, was das Modell im Nachhinein mit der Antwort des Werkzeugs macht, ist dieser Teil des Beispiels auf ein Minimum reduziert.

Function Calling mit LangChain in TypeScript

Verknüpft wird das Ganze in der extractWorkTimeInMinutes-Funktion. Das Modell wird instanziiert und durch bindTools mit unserem kleinen Werkzeug bereichert.

1async function extractWorkTimeInMinutes(text: string): Promise<number> {  
2  const model = new AzureChatOpenAI().bindTools([workdayTool])  
3  const result = await model.invoke([  
4    ...promptWithExample,  
5    new HumanMessage(text),  
6  ])  
7  const { start, end, breaks } = result.tool_calls[0].args  
8  return calculateTotalWorkDayTime(start, end, breaks)  
9}

Da wir in unserem kleinen Use Case davon ausgehen, dass nur ein Tool Call gemacht wird, greifen wir genau diesen ab und rufen damit die Berechnungslogik auf. Das ist natürlich überhaupt nicht fehlertolerant, reicht für jetzt aber erstmal aus.

Das UI

Ähnlich wie im RAG-Artikel können wir mit Backroad ganz einfach ein UI für unsere Arbeitszeitberechnung erstellen.

1function startChatUI() {  
2  run(async (br) => {  
3    const messages = br.getOrDefault("messages", [  
4      { by: "ai", content: "Beschreibe deinen Arbeitstag!" },  
5    ])  
6  
7    messages.forEach((message) => {  
8      br.chatMessage({ by: message.by }).write({ body: message.content })  
9    })  
10  
11    const input = br.chatInput({ id: "input" })  
12    if (input) {  
13      const response = await extractWorkTimeInMinutes(input)  
14      br.setValue("messages", [  
15        ...messages,  
16        { by: "human", content: input },  
17        { by: "ai", content: `Du hast ${response/60} Stunden gearbeitet` },  
18      ])  
19    }  
20  })  
21}

Im Browser sieht das Ergebnis dann so aus:

Das System erkennt korrekt, dass ich 7,75h gearbeitet habe

Es sieht also so aus, als ob dir noch eine Viertelstunde konzentrierten Codings fehlen. Zufällig genau so viel Zeit, wie du benötigst, um diesen Artikel zu lesen. 😉 Der von ChatGPT generierte Toolcall dafür war:

1[
2  {
3    "name": "workDay",
4    "args": {
5      "start": "07:00",
6      "end": "16:00",
7      "breaks": [
8        {
9          "start": "12:00",
10          "end": "12:30"
11        },
12        {
13          "start": "14:00",
14          "end": "14:45"
15        }
16      ]
17    },
18    "id": "call_Tt33yfzlfOrPxLK4ujlPoPis"
19  }
20]

Stolpersteine im Umgang mit Function Calling

Auch wenn es mir seit Wochen nicht gelingt, meinen Enthusiasmus über diesen Ansatz im Zaum zu halten, gibt es noch ein paar Kanten, die beachtet werden sollten.

Unvorhersehbar

Für Function Calling gilt, wie bei allen anderen GenAI-Ansätzen auch, dass die Ausgabe letztlich nicht deterministisch ist. Durch das Einpflegen von Beispielen, das Verfeinern von Prompts und einer klaren Toolbeschreibung, lassen sich die Ergebnisse zwar verbessern, dennoch ist es wichtig, eine ausgereifte Fehlerbehandlung zu etablieren. Das kann jedoch auch vor dem Nutzer versteckt werden, zum Beispiel könnte man Nutzereingaben zuvor in ein besser interpretierbares Format gießen mithilfe eines weiteren LLM-Prompts. Eine andere Möglichkeit sind automatisierte Reruns bei fehlerhafter oder nicht ausreichender Ausgabe.

Nicht lokal?

Ich habe einfachheitshalber Azure OpenAI genutzt, dessen Function Calling im Vergleich zu anderen Modellen zu einem der Besten gehört. Das hat den Nachteil des nötigen Online-Zugangs. Gerade das zuvor genutzte llama3 (8B) glänzt nicht gerade mit Zuverlässigkeit in diesem Bereich. Dennoch kommen immer wieder auch kleinere Modelle wie zum Beispiel Gorillas OpenFunctions in der Bestenliste vor. Für den heutigen Use Case war dieses leider nicht gut zu gebrauchen, denn die quantisierte Version konnte lokal nicht zuverlässig Ergebnisse für die deutsche Sprache liefern. Außerdem ist deren Syntax eine etwas andere. Hat man die nötige Hardware, lassen sich aber natürlich auch größere Modelle lokal aufsetzen und Function Calling ohne Cloud realisieren.

Vorteile von Function Calling

Nachdem wir nun über ein paar Nachteile gesprochen haben, kann ich endlich ins Schwärmen kommen. Function Calling hat die folgenden größten Vorteile.

Einfachheit

Wie schon zu Beginn angedeutet, ist unser Interface nun maximal klar gehalten. Wir haben ein einfaches Textfeld, um selbst komplexere Eingaben für die NutzerInnen verständlich anzubieten. Es liegt nun nur noch die Sprache zwischen Nutzer und Logik.

Sprachverständnis

Das System hat durch ChatGPT ein überragendes Textverständnis. Es lässt sich nicht betonen, wie mächtig das eigentlich ist. Ich habe im Beispiel unterschiedlichste Wege genutzt, um Zeitspannen zu bezeichnen. Mal habe ich "3/4" geschrieben, mal die Zahl ausgeschrieben oder nur auf eine zuvor genannte Zahl referenziert. Mit LLMs kann man heute echtes Sprachverständnis nutzen und muss nicht wie früher auf eine mehr oder weniger strukturierte Keywordsuche hoffen. Das bedeutet auch, dass unsere App automatisch in jeder von ChatGPT verstandenen Sprache nutzbar ist – das kommt einfach so "umsonst" dazu.

Plötzlich versteht das System deutlich mehr Sprachen als ich

Automatisierung

Dadurch, dass die Ausgabe nun zwingend im gleichen Format kommt, lässt sich jedes Tool einfach automatisieren. Wir müssen nicht mehr darauf hoffen, dass ChatGPT das korrekte Format trifft, und gerade für komplexere Anwendungsfälle als den heutigen bekommt das System so eine deutlich höhere Verlässlichkeit.

Entwicklungsansätze

Um die Zuverlässigkeit und Qualität des Systems weiter zu erhöhen, gibt es wieder einige Ansätze. Unter anderen:

Durch eine Aufbereitung der Eingabe mit LLMs könnten komplexere oder wenig verständliche Texte zunächst auf ihre wichtigsten Aussagen reduziert werden.
Noch barrierefreier wäre eine Spracheingabe. Das ließe sich wiederum auch mit entsprechenden GenAI-Modellen umsetzen und wir hätten selbst das letzte Eingabefeld abstrahiert. Das würde sicher die Barrierefreiheit noch weiter erhöhen, besonders durch die wesentlich niedrigere Sprachbarriere.
Mit einer Chathistorie könnte das LLM sogar noch mehr Kontext der Anfrage verstehen und selbst gestückelte Texte bearbeiten.

The Sky is the Limit

Mit Function Calling lassen sich zahlreiche Interfaces neu denken. Seitdem ich diesen Ansatz kenne, kommt mir fast täglich ein neuer Anwendungsfall in den Sinn. Ich bin der Meinung, dass hier noch sehr viel Potenzial auf der Straße liegt. Vielleicht habe ich es geschafft, in den letzten Minuten auch bei dir den Funken überspringen zu lassen. Die Full Stack Welt und nicht zuletzt sicher auch die Anbieter der großen LLM-Modelle 💰 könnten davon nur profitieren.

Nachdem wir dieses Mal einen aufregenden Schritt in Richtung Automatisierung genommen haben, werde ich in meinem nächsten Artikel sogar noch eine Schippe drauflegen. Ich betrachte, wie mithilfe von Function Calling aktiv handelnde Agenten implementiert werden können. Systeme, die selbst entscheiden, welche die besten nächsten Schritte sind und diese sogar ausführen. Mit diesem etwas gruseligen Ausblick entlasse ich dich nun in deine IDE. Viel Spaß!

War dieser Beitrag hilfreich?

Beitrag teilen

Blog-Autor*in

Robin Schlenker

Full Stack Consultant

Du hast noch Fragen zu diesem Thema? Dann sprich mich einfach an.

Weitere Beiträge

von Robin Schlenker

GenAI für Full Stack EntwicklerInnen - Agent Chi PiTie (Teil 5)

Künstliche Intelligenz ist heutzutage in aller Munde. Die Einsatzgebiete sind vielfältig, der "WOW-Faktor" immer gegeben und das Potenzial noch lange nicht ausgeschöpft. Wo wir heute in vielen Bereichen schon unsere früheren Erwartungen übertroffen ...

LLM
Generative KI
Künstliche Intelligenz

20.8.2024 | 13 Minuten Lesezeit

Robin Schlenker

GenAI für Full Stack EntwicklerInnen: RAG Evaluation mit TypeScript (Teil...

Disclaimer: Dieser Artikel ist Teil einer Serie. Lies am besten zuerst Teil 1 und Teil 2, um auf dem neuesten Stand zu sein. In der traditionellen Softwareentwicklung sind Tests ein essenzieller Bestandteil. Wir nutzen E2E-Tests, Unit- und Integrationstests...

LLM
Künstliche Intelligenz
Generative KI

3.7.2024 | 14 Minuten Lesezeit

Robin Schlenker

GenAI für Full Stack EntwicklerInnen: Der erste echte Use Case (Teil 2...

Disclaimer: Dieser Artikel ist Teil einer Serie, wenn du den ersten Teil noch nicht gelesen hast dann findest du ihn hier. Nachdem wir beim letzten Mal einen ersten Kontakt mit Open Source LLMs hatten, geht es heute endlich ans Codieren! Die Chatbots...

Künstliche Intelligenz
LLM
Generative KI

24.6.2024 | 10 Minuten Lesezeit

Robin Schlenker

GenAI für Full Stack EntwicklerInnen: Aller Anfang ist... lokal? (Teil...

Als Full Stack EntwicklerIn gibt es heutzutage wohl genug Themenkomplexe zur Einarbeitung. Ob das nächste Frontend-Framework des Jahres, die neue Backend-Technologie, ein weiterer Security-Scanner oder doch nur eine weitere Cloud-Integration: Die Auswahl...

LLM
Künstliche Intelligenz
Generative KI

14.6.2024 | 7 Minuten Lesezeit

Robin Schlenker

Dein Job bei codecentric?

Jobs

Agile Developer und Consultant (w/d/m)

Alle Standorte

Vibe coding – Was nun?

Kann man mit KI wirklich Anwendungen erzeugen, ohne selbst coden zu können, mit einem Bruchteil des Aufwands und der Zeit? "Gib dich dem Vibe hin! Erstelle Software nur mit natürlicher Sprache! GenAI ist der Builder. Hör auf, dich zu beschweren und fang...

Künstliche Intelligenz
Generative KI

12.4.2025 | 9 Minuten Lesezeit

Goetz Markgraf

Open Source trifft Milliardenmarkt: DeepSeek-R1 mischt die KI-Welt auf

Am 27. Januar 2025 erlebte die Technologiebörse einen unerwarteten Einbruch: Der NVIDIA-Aktienkurs fiel um über 17%, wodurch der Konzern zeitweilig fast 600 Milliarden US-Dollar an Börsenwert verlor und damit einen neuen historischen Rekord am Aktienmarkt...

Künstliche Intelligenz
Generative KI
LLM

29.1.2025 | 8 Minuten Lesezeit

Daniel Ladischenski

Wie wir eine KI mit wenigen Worten hacken können

Wie wir eine KI mit wenigen Worten hacken können Künstliche Intelligenz (KI) hat in den letzten Jahren einen erstaunlichen Wandel durchgemacht und ist mittlerweile in vielen Lebensbereichen präsent. Ob in Form von Chatbots, die uns bei alltäglichen Fragen...

IT-Security
Künstliche Intelligenz

27.1.2025 | 4 Minuten Lesezeit

Mehmet Avci

GenAI für Full Stack EntwicklerInnen - Agent Chi PiTie (Teil 5)

LLM
Generative KI
Künstliche Intelligenz

20.8.2024 | 13 Minuten Lesezeit

Robin Schlenker

GenAI für Full Stack EntwicklerInnen: RAG Evaluation mit TypeScript (Teil...

LLM
Künstliche Intelligenz
Generative KI

3.7.2024 | 15 Minuten Lesezeit

Robin Schlenker

GenAI für Full Stack EntwicklerInnen: Der erste echte Use Case (Teil 2...

Künstliche Intelligenz
LLM
Generative KI

24.6.2024 | 11 Minuten Lesezeit

Robin Schlenker

GenAI für Full Stack EntwicklerInnen: Aller Anfang ist... lokal? (Teil...

LLM
Künstliche Intelligenz
Generative KI

14.6.2024 | 7 Minuten Lesezeit

Robin Schlenker

Eine Einführung in das Thema künstliche Intelligenz für Schülerinnen und...

Die Bedeutung von künstlicher Intelligenz wächst in der heutigen Welt. Doch wie funktioniert KI? Es hat zumindest nichts mit Magie zu tun – auch wenn KI gerne damit assoziiert wird. Normalerweise beantworte ich diese Frage ausführlich bei uns im IT ...

Künstliche Intelligenz

30.1.2024 | 3 Minuten Lesezeit

Meike Wocken

Ersetzt KI die Softwareentwickler?

In meinem letzten Blogartikel habe ich geschrieben, was KI-Tools wie ChatGPT heute schon leisten können, wenn es darum geht, fachliche Anwendungen in ausführbaren Programmcode zu übersetzen. Ich habe erfahren, dass die Ergebnisse zwar noch nicht zu 1...

Künstliche Intelligenz

10.9.2023 | 6 Minuten Lesezeit

Goetz Markgraf

KI-Tools zum Lernen neuer Programmiersprachen: Ein Erfahrungsbericht

Einleitung KI-Tools, die die Arbeit des Softwareentwicklers unterstützen – oder eventuell sogar ganz ersetzen – sorgen im Moment für Schlagzeilen. In diesem Artikel möchte ich einen ganz persönlichen Erfahrungsbericht schreiben, wie es mir erging, als...

Künstliche Intelligenz

4.9.2023 | 8 Minuten Lesezeit

Goetz Markgraf

ChatGPT im Alltag eines Python-Entwicklers

Seit einigen Tagen spiele ich mit ChatGPT herum. Beruflich und privat konnte ich damit einige Fragen bearbeiten, bspw. welche Alternativen es zu bestimmten Tools gibt, was Vorteile von Teilzeit für den Arbeitgeber sind oder wer ich bin. Leider weiß ChatGPT...

NLP
Python
Künstliche Intelligenz

27.1.2023 | 7 Minuten Lesezeit

Robert Meißner

GitHub Copilot – Pair Programming mit der KI

Vor drei Monaten konnte ich zum ersten Mal mit GitHub Copilot von Microsoft auf die Startbahn gehen. Ob der Flug erfolgreich war oder ob ich es gar nicht in die Luft geschafft habe, möchte ich euch einmal berichten. Was ist GitHub Copilot? Der Copilot...

Künstliche Intelligenz
GitHub
Microsoft

6.10.2022 | 8 Minuten Lesezeit

Danny Steinbrecher

Smart DistancR – Perspektivisch korrekte Distanzmessung zwischen Personen

Die Corona-Krise ist weiterhin in aller Munde und wird uns mit hoher Wahrscheinlichkeit noch etwas länger begleiten. Wie man aus unterschiedlichen Statistiken erfährt, schwanken die Fallzahlen weiter und sorgen für zusätzliche Restriktionen. Diese werden...

Computer Vision
Künstliche Intelligenz
IoT
Machine Learning

13.12.2021 | 7 Minuten Lesezeit

Michel Ehmen

Wie man Java-Klassen in Python benutzt

Generell sollte man zwar für jedes Problem das passende Werkzeug nutzen. Aber oftmals wird man gezwungen, den Hammer Java zu nutzen, weil der Rest des Hauses mit diesem Hammer gebaut wurde. Eine moderne Lösung dieses Problems ist natürlich die Microservice...

Künstliche Intelligenz
Java
Python

15.11.2021 | 8 Minuten Lesezeit

Hendrik Schawe

Schnelles KI-Prototyping mit Google Cloud AutoML Vision

Bei klassischen Machine-Learning-(ML-)Projekten beschäftigen sich Data Scientists häufig längere Zeit (mehrere Monate) mit der Entwicklung eines ML-Modells. Dabei werden hohe Kosten verursacht und die Zeit, bis ein erstes Modell zur Verfügung steht, ...

Cloud
Computer Vision
Data
Künstliche Intelligenz
Google Cloud
Machine Learning

17.5.2021 | 5 Minuten Lesezeit

Nils Bauroth

Sven Rediske

Technologien lösen keine Probleme ― es sind die Menschen dahinter

Software zu entwickeln bedeutet, Mehrwert für den Kunden zu schaffen. Zu oft wird hierbei der menschliche Faktor im System missachtet. Stefanie Hasler, Senior Fullstack Developerin bei codecentric, gibt einen kleinen Einblick auf ihre Sicht der Dinge...

Künstliche Intelligenz
Softwareentwicklung
Remote Work
HR
Collaboration
Kultur

22.3.2021 | 6 Minuten Lesezeit

Kathrin Schaugg

Stefanie Hasler

KI in der Praxis: Fehlerhafte Bauteile mit Rekognition auf AWS identifizieren

Noch vor kurzer Zeit mussten für den Einsatz von künstlicher Intelligenz (KI) unter großem Aufwand eigene KI-Modelle erstellt werden. Heute ist für viele Anwendungsfälle die Einstiegshürde in die Welt der KI durch Cloud-Computing-Dienste stark gesunken...

Cloud
Computer Vision
Data
Künstliche Intelligenz
Machine Learning
Python

29.7.2020 | 11 Minuten Lesezeit

Marcel Mikl

Nico Axtmann

KI in der Praxis: Fehlerhafte Bauteile mit AutoML in der Google Cloud ...

Noch vor kurzer Zeit war der Einsatz von künstlicher Intelligenz (KI) nur mit großem Aufwand und Konstruktion eigener neuronaler Netze möglich. Heute ist die Einstiegshürde in die Welt der KI durch Cloud-Computing-Dienste stark gesunken. So kann man ...

Cloud
Computer Vision
Data
Python
Machine Learning
Google Cloud
Künstliche Intelligenz

8.7.2020 | 11 Minuten Lesezeit

Nico Axtmann

Marcel Mikl

KI für KMU: (Teil-)Automatisierung der Qualitätskontrolle von Bauteilen

Noch vor kurzer Zeit war der Einsatz von künstlicher Intelligenz (KI) nur mit großem Aufwand und ausreichend Spezialwissen möglich. Hauptsächlich große Internet-Konzerne wie Google, Apple und Facebook hatten das Geld, die Daten und die Expertise, um ...

Data
Machine Learning
Künstliche Intelligenz

6.7.2020 | 7 Minuten Lesezeit

Marcel Mikl

Nico Axtmann

Machine Learning in der Praxis. Eine Mate mit … Matthias Niehoff #EineMateMit

Machine Learning und künstliche Intelligenz sind aktuell in aller Munde und versprechen vielfältige Einsatzmöglichkeiten im Unternehmen. Trotzdem tun sich viele Unternehmen aktuell noch schwer, das Potential der Technologie zu nutzen. „Der Fokus liegt...

Künstliche Intelligenz
Data
Community
Machine Learning

27.5.2020 | 1 Minuten Lesezeit

Matthias Niehoff

Jetzt für unseren Newsletter anmelden

Alles Wissenswerte auf einen Klick:
Unser Newsletter bietet dir die Möglichkeit, dich ohne großen Aufwand über die aktuellen Themen bei codecentric zu informieren.

GenAI für Full Stack EntwicklerInnen: Sprachverständnis als User Interface (Teil 4)

Das Szenario

Was ist Function Calling?

Projekt Setup

Der Code

Das Werkzeug

Function Calling Prompt mit Beispiel

Function Calling mit LangChain in TypeScript

Das UI

Stolpersteine im Umgang mit Function Calling

Unvorhersehbar

Nicht lokal?

Vorteile von Function Calling

Einfachheit

Sprachverständnis

Automatisierung

Entwicklungsansätze

The Sky is the Limit

War dieser Beitrag hilfreich?

Blog-Autor*in

Weitere Beiträge

GenAI für Full Stack EntwicklerInnen - Agent Chi PiTie (Teil 5)

GenAI für Full Stack EntwicklerInnen: RAG Evaluation mit TypeScript (Teil...

GenAI für Full Stack EntwicklerInnen: Der erste echte Use Case (Teil 2...

GenAI für Full Stack EntwicklerInnen: Aller Anfang ist... lokal? (Teil...

Dein Job bei codecentric?

Agile Developer und Consultant (w/d/m)

Weitere Artikel in diesem Themenbereich

Vibe coding – Was nun?

Open Source trifft Milliardenmarkt: DeepSeek-R1 mischt die KI-Welt auf

Wie wir eine KI mit wenigen Worten hacken können

GenAI für Full Stack EntwicklerInnen - Agent Chi PiTie (Teil 5)

GenAI für Full Stack EntwicklerInnen: RAG Evaluation mit TypeScript (Teil...

GenAI für Full Stack EntwicklerInnen: Der erste echte Use Case (Teil 2...

GenAI für Full Stack EntwicklerInnen: Aller Anfang ist... lokal? (Teil...

Eine Einführung in das Thema künstliche Intelligenz für Schülerinnen und...

Ersetzt KI die Softwareentwickler?

KI-Tools zum Lernen neuer Programmiersprachen: Ein Erfahrungsbericht

ChatGPT im Alltag eines Python-Entwicklers

GitHub Copilot – Pair Programming mit der KI

Smart DistancR – Perspektivisch korrekte Distanzmessung zwischen Personen

Wie man Java-Klassen in Python benutzt

Schnelles KI-Prototyping mit Google Cloud AutoML Vision

Technologien lösen keine Probleme ― es sind die Menschen dahinter

KI in der Praxis: Fehlerhafte Bauteile mit Rekognition auf AWS identifizieren

KI in der Praxis: Fehlerhafte Bauteile mit AutoML in der Google Cloud ...

KI für KMU: (Teil-)Automatisierung der Qualitätskontrolle von Bauteilen

Machine Learning in der Praxis. Eine Mate mit … Matthias Niehoff #EineMateMit

Jetzt für unseren Newsletter anmelden