
Nano Banana
Kurzfassung
▾
Quellen
▾
OpenAI führt mit einem neuen Update die Sprach- und Textsteuerung in ChatGPT nahtlos in einer einzigen Benutzeroberfläche zusammen. Nutzer sehen nun während des Sprechens Echtzeit-Transkripte sowie visuelle Inhalte wie Karten oder Bilder direkt im Chatverlauf. Der bisherige isolierte Sprachmodus entfällt als Standard, lässt sich jedoch für Puristen über die Einstellungen manuell wieder aktivieren.
TechBuzz – ChatGPT Voice Gets Major UX Upgrade
Moneycontrol – OpenAI rolls out new unified ChatGPT Voice experience
TechCrunch – ChatGPT's voice mode is no longer a separate interface
Thurrott – ChatGPT's Voice Mode is Now Built Into Chat
News9Live – OpenAI Rolls Out New ChatGPT Voice Mode
OpenAI verabschiedet sich von getrennten Welten bei ChatGPT. Ein neues Update führt Sprachbefehle und Textnachrichten direkt zusammen. Nutzer sprechen nun mit der KI und sehen parallel die Antworten auf dem Display, ohne die gewohnte Chat-Umgebung zu verlassen. Das Ende des isolierten Sprachmodus Der bisherige blaue, pulsierende Kreis als exklusives Interface gehört der Vergangenheit an. Bislang wechselte die App beim Start einer Sprachunterhaltung automatisch in einen abgetrennten Vollbildmodus. Das Update beseitigt diesen visuellen Bruch vollständig. Stattdessen bleibt die bekannte Chat-Oberfläche auch während des Sprechens dauerhaft aktiv. Das gesprochene Wort verwandelt sich dabei in Echtzeit in lesbaren Text. Anwender verfolgen die Antworten der KI direkt mit, während diese ausgesprochen werden. Ein Wechsel zwischen Tippen und Reden funktioniert ab sofort ohne Verzögerung in derselben Ansicht. Diese Änderung zielt auf eine deutlich intuitivere Bedienung ab, bei der die Art der Eingabe keine Rolle mehr spielt und der Workflow nicht unterbrochen wird. Mehr Kontext durch visuelle Elemente Die Verschmelzung bringt konkrete funktionale Vorteile für komplexe Aufgaben. Visualisierungen wie Karten, Diagramme oder generierte Bilder erscheinen nun direkt im laufenden Gespräch auf dem Schirm. Früher war für die Betrachtung solcher Inhalte oft ein umständlicher Wechsel aus dem Sprachmodus heraus nötig. Gleichzeitig bleibt der gesamte Kontext der Unterhaltung jederzeit griffbereit. Während die KI spricht, lässt sich problemlos durch den Chatverlauf scrollen, um frühere Aussagen oder Daten zu prüfen. Informationen gehen nicht mehr im flüchtigen Audio-Stream verloren. Das System hält alle Daten visuell fest und unterstützt so auch längere, inhaltsreiche Dialoge deutlich effizienter als zuvor. Wahlfreiheit in den Einstellungen Trotz der offensichtlichen Vorteile erzwingt OpenAI den Wechsel nicht radikal. Manche Nutzer bevorzugen eventuell weiterhin die ablenkungsfreie Umgebung des ursprünglichen Designs ohne mitlaufenden Text. Für diese Gruppe steht in den Systemeinstellungen ein entsprechender Schalter bereit. Dort lässt sich die klassische Vollbild-Ansicht bei Bedarf reaktivieren. Wer den Fokus rein auf das Audio-Erlebnis legt, bekommt so das gewohnte Verhalten zurück. Mit diesem Update unterstreicht OpenAI den Anspruch, die Interaktion mit künstlicher Intelligenz so natürlich und barrierefrei wie möglich zu gestalten.
Weiterlesen...