Juli 27, 2024

Mixery Raw Deluxe

Nachrichten, ausgefallene Geschichten und Analysen zum deutschen und internationalen Geschehen. Tauchen Sie tiefer ein mit unseren Features aus Europa und darüber hinaus. Sehen Sie sich unseren 24/7-TV-Stream an.

OpenAI gibt ChatGPT eine Stimme: Chatbot kann jetzt mit Benutzern sprechen

OpenAI gibt ChatGPT eine Stimme: Chatbot kann jetzt mit Benutzern sprechen
Überprüfen Sie die neueste Version von Chatgpt

OpenAI hat ein neues Modell der künstlichen Intelligenz vorgestellt, das die Art und Weise verändern wird, wie Benutzer mit ChatGPT interagieren. Chatbots sind jetzt in der Lage, Video- und Textinhalte zu verstehen und auf Benutzeranfragen zu reagieren.

„Dieses Update ist viel schneller und verbessert die Text-, Bild- und Audiofunktionen“, sagte Meera Murati, CTO von OpenAI, während der Enthüllungsveranstaltung des Unternehmens. Dieses Update hat gezeigt, wie es funktionieren wird, und es wird allen Benutzern kostenlos zur Verfügung stehen.

Eine der interessantesten Funktionen von GPT-4o ist seine „native multimodale“ Fähigkeit. Das ist was es bedeutet Das Modell kann Inhalte generieren oder Befehle in Sprache, Text oder Bildern verstehen und eröffnet so viele Möglichkeiten in der Interaktion zwischen Mensch und KI.

Die GPT-4o-Anwendung ist schneller als ihr Vorgänger. (OpenAI)

Vor der Einführung von GPT-4o gab es Spekulationen über die Pläne von OpenAI, die vom Aufbau einer KI-Suchmaschine als Konkurrenz zu Google über die Einführung eines integrierten Sprachassistenten in GPT-4 bis hin zur Einführung eines völlig neuen GPT-5 reichten.

Mit der Ankündigung von GPT-4o wollte sich OpenAI jedoch voll und ganz auf das Benutzererlebnis konzentrieren. Denn es handelt sich im Wesentlichen um die gleichen Möglichkeiten zur Inhaltserstellung wie bei der herkömmlichen Version, jedoch mit zusätzlicher Stimme.

Bisher war die Interaktion mit ChatGPT hauptsächlich auf Text beschränkt, doch mit der Einführung von Sprache können Benutzer jetzt intuitiver und natürlicher mit dem System interagieren. Dies wird durch die Fähigkeit von GPT-4o erreicht, Antworten in Echtzeit zu generieren, die Emotionen in der Stimme des Benutzers einzufangen und sie in verschiedenen Formaten wiederzugeben.

Siehe auch  Eine Anleitung zu WhatsApp Web, um Sie zu benachrichtigen, wenn Ihre Kontakte "online" sind.

Bezüglich der Verfügbarkeit hat OpenAI bestätigt, dass GPT-4o allen ChatGPT-Benutzern kostenlos zur Verfügung stehen wird. Außerdem, Bezahlte Nutzer profitieren von bis zu fünfmal höheren Kapazitätsgrenzen als kostenlose Nutzer.

Chatgpt-4o Spanisch lernen

Die Sprachaktivierung in ChatGPT verbessert nicht nur das Benutzererlebnis, sondern erweitert auch die Möglichkeiten der Plattform erheblich. Jetzt kann ChatGPT nicht nur auf Textanfragen antworten, sondern auch Antworten auf der Grundlage von Sprachbefehlen verstehen und generieren, was es zu einem noch vielseitigeren und leistungsfähigeren Tool macht.

Zusätzlich zur Sprache erweitert GPT-4o auch die Fähigkeiten von ChatGPT im visuellen Bereich. Jetzt, Das System kann Bilder oder Screenshots analysieren und relevante Informationen oder Antworten auf spezifische Fragen liefern.

Entwickler profitieren außerdem von der Verfügbarkeit von GPT-4o über die OpenAI-API. Diese API ermöglicht den Zugriff auf das Modell zu halben Kosten und doppelt so schnell wie GPT-4 Turbo und ermöglicht es Entwicklern, Sprachfunktionen in ihre eigenen Anwendungen und Systeme zu integrieren, was neue Möglichkeiten in der KI-Anwendungsentwicklung eröffnet.

Jetzt können Sie mathematische Operationen anhand eines Fotos ausführen. (Offene KI)

Um diese Innovation zu verstehen, zeigte OpenAI eine lange Liste von Beispielen, denn die Möglichkeiten, die dieses neue Sprachmodell bietet, sind riesig und Benutzer können Optionen entdecken. Von einfachen Gesprächsanfragen über Echtzeitübersetzungen bis hin zur Analyse des Programmiercodes. Hier sind einige Beispiele:

  • Lässiger Chat: ChatGPT kann jetzt flüssiger reagieren, da es nicht die Stimme des Benutzers nimmt, sie in Text umwandelt und dann das Audioergebnis zurückgibt. Überspringen Sie diesen Vorgang und antworten Sie sofort mit Ihrer Stimme in einem freundlichen, lustigen und zugänglichen Ton. Sie können also ein normales Gespräch führen, ihm Fragen stellen, Quests erledigen und ihn um Hilfe bitten.
  • Übersetzung: Während der Präsentation testeten sie ChatGPT, um Konversationen auf Englisch und Italienisch in Echtzeit zu dolmetschen. Der Assistent nahm die Stimme in jeder Sprache auf und übersetzte sie sofort. Ein nützliches Werkzeug für Reisen, Meetings und mehr.
  • Bildanalyse: Der Chatbot hat Zugriff auf die Kamera des Benutzers und kann so Bilder zeigen, um ein mathematisches Problem zu lösen, sagen, was ein Objekt ist, oder Stein, Papier oder Schere spielen.
  • Code- und Diagrammanalyse: ChatGPT versteht die gleichen Programmiercodes wie seine herkömmliche Version, aber mit dem Unterschied, dass es eine Sprachantwort gibt, wird alles flüssiger sein. Darüber hinaus können Sie Bilder vom Computer abrufen und diese analysieren, um Inhalte zu erstellen.
Siehe auch  Ein atemberaubender Sonnenfleck, der viermal so groß ist wie die Erde, bereitet Wissenschaftlern Sorgen