Kennst du das Gefühl, wenn du morgens aufwachst und schon an all die Aufgaben denkst, die heute auf dich warten? Die Wäsche muss gemacht werden, E-Mails stapeln sich, der Chef will eine Auswertung, das Kind braucht eine Einladung zum Kindergeburtstag und dann ruft auch noch die Versicherung an. Manchmal fühlt sich das Leben an wie ein riesiges To-do-Listen-Monster, das täglich gefüttert werden will. Aber was wäre, wenn du kleine, fleißige Helfer hättest, die dir einen Teil dieser Arbeit einfach abnehmen? Klingt nach Science-Fiction? Ist es aber nicht! Genau hier kommen Workflows und Agenten ins Spiel – und die können deinen Alltag und auch das Büro-Leben ziemlich auf den Kopf stellen.
Echtzeit-KI ist gerade eines der spannendsten Themen, wenn man sich ein bisschen in der Azure-Welt umschaut. Zwei Dienste, die dabei besonders ins Auge springen, sind GPT‑4o Realtime und die Voice Live API. Auf den ersten Blick scheinen sie fast gleich: Beide ermöglichen es, mit der KI in Echtzeit zu interagieren. Aber wenn man etwas genauer hinschaut, merkt man schnell, dass sie sich in Architektur, Anwendungsfällen und technischen Details doch stark unterscheiden.
Es gibt Situationen, da ist die Cloud keine Option. Nicht, weil ich ihr misstraue oder Angst um meine Daten hätte – im Gegenteil, viele meiner Projekte laufen ganz selbstverständlich über Cloud-Dienste. Aber manchmal lassen es die Umstände einfach nicht zu: ein abgeschottetes Unternehmensnetzwerk, ein Kundenprojekt mit strengen Compliance-Regeln, ein Arbeitsplatz ohne durchgängige Internetverbindung. Genau hier kommt Foundry Local ins Spiel und eröffnet Möglichkeiten, die ich bislang so nicht hatte.
Stell dir vor, dein Computer ‒ dein Bildschirm, deine Maus, deine Tastatur ‒ könnte sprechen. Also: Nicht im Sinne eines sprechenden PC-Geists, aber fast so. Wenn du sagst: „Hey, überprüfe die neuesten Fehlermeldungen im Dashboard, öffne das Ticket-Tool, trag die Daten ein, und schicke den Bericht raus“ ‒ und das passiert alles automatisch. Ohne dass du manuell klickst, kopierst oder zwischen Apps wechselst. Genau das bringt Microsofts neues Computer Use Tool (Preview) im Azure AI Foundry Agent Service mit sich.
Stell dir vor, du baust eine Anwendung, die auf Azure OpenAI setzt. Mal ist die Auslastung eher gemütlich, mal schießen die Anfragen durch die Decke. Genau in solchen Momenten zeigt sich, ob dein Setup robust genug ist, um nicht ins Wanken zu geraten. Und genau hier kommt das Thema Spillover Traffic Management ins Spiel. Vor allem dann, wenn du Provisioned Throughput Units (PTUs) im Einsatz hast, lohnt sich ein genauer Blick, denn Spillover kann dir richtig Arbeit und Kopfschmerzen ersparen.