Mai 6, 2024

Mixery Raw Deluxe

Nachrichten, ausgefallene Geschichten und Analysen zum deutschen und internationalen Geschehen. Tauchen Sie tiefer ein mit unseren Features aus Europa und darüber hinaus. Sehen Sie sich unseren 24/7-TV-Stream an.

Google hat eine neue Version seiner Gemini AI-Anwendung auf den Markt gebracht | Das System analysiert Texte und lange Videos gründlich, indem es Befehlen Folge leistet

Google hat eine neue Version seiner Gemini AI-Anwendung auf den Markt gebracht |  Das System analysiert Texte und lange Videos gründlich, indem es Befehlen Folge leistet

Der Technologieriese Google stellte Gemini 1.5 Pro vor, das große Informationsmengen gleichzeitig verarbeiten kann, darunter eine Stunde Video, elf Stunden Audio, 30.000 Zeilen Programmcode oder mehr als 700.000 Wörter. Vorerst hat eine ausgewählte Gruppe von Technologieentwicklern testweise Zugriff darauf, und dann wird es öffentlich veröffentlicht.

„Vor ein paar Jahren war es sehr schwierig, sich Hunderte von Wörtern zu merken oder den Kontext zu erfassen“, sagte Oriol Vinyals, Vizepräsident für Forschung bei Google DeepMind und CEO von Gemini, gegenüber Reportern. Um die Fähigkeiten von Gemini 1.5 Pro zu veranschaulichen, verwendete Vinyals einen 402 -Seitentext von der Apollo 11-Mission – der Mission zum Mond – und ein Video, das zeigt, dass es drei lustige Zitate erkennen konnte, d. h. es beginnt, die Bedeutung dieser KI-Sätze zu analysieren.

Mit öffentlichem Zugang können Benutzer die Erstellung von Fotos und Karten anfordern. Im Video kann ein Benutzer sehen, wie der Gemini 1.5 Pro ganz einfach zeichnet und auf den Boden tritt und fragt: „Welcher Moment ist das? Antworte mir mit einem Textzitat.“ Die Antwort der Maschine ist das berühmte Zitat des Astronauten Neil Armstrong: „Das ist ein kleiner Schritt für den Menschen.“

In Bezug auf die Programmierung heißt es in einer Unternehmenserklärung, dass Gemini 1.5 Pro „verwandte Debugging-Aufgaben für lange Codeblöcke durchführen kann“. Bei einer Nachricht mit mehr als 100.000 Zeilen kann es nützliche Änderungen vorschlagen und Erklärungen zur Funktionsweise verschiedener Teile des Codes liefern „In mancher Hinsicht funktioniert das ganz ähnlich wie unser Gehirn“, erklärte Vinyals.

Gemini 1.5 Pro wird Softwareentwicklern dabei helfen, nützlichere Modelle und Anwendungen zu erstellen, sagte Sundar Pichai, CEO von Google und Alphabet: „Wir freuen uns, Entwicklern und Unternehmenskunden eine begrenzte Vorschau dieser experimentellen Funktion anbieten zu können.“

Siehe auch  Dieser Skyrim-Bericht verrät, welches Rennen am häufigsten im Spiel vorkommt

Was „Halluzinationen“ betrifft – gut konstruierte, aber falsche Antworten – weist Vinyals darauf hin, dass dies immer noch ein Problem in der KI im Allgemeinen darstellt.
Letzte Woche hat Google den Namen seines Chatbots für künstliche Intelligenz (KI) von Bard in Gemini geändert. Außerdem wurde angekündigt, dass die Technologie über die neue Gemini-App für Android und die Google-App für iOS verfügbar sein wird.

Gemini 1.5 Pro ist ein mittelgroßes multimodales Modell, das insofern innovativ ist, als es sehr lange Dokumente rechtfertigen kann, vom Vergleich von Vertragsdetails bis hin zur Zusammenfassung und Analyse von Themen und Konzepten in Analystenberichten, Forschungsstudien oder Buchreihen.

Durch die Analyse und den Vergleich von Inhalten aus mehreren Stunden Video können Sie bestimmte Details im Spielmaterial erkennen oder detaillierte Informationen aus Zusammenfassungen von Videobesprechungen gewinnen, die präzise Fragen und Antworten unterstützen. Ihr Chatbot-System kann lange Gespräche führen, ohne Details zu vergessen, selbst bei komplexen Aufgaben oder mehreren Folgeinteraktionen. Und es ermöglicht hochgradig personalisierte Erlebnisse durch die Einbindung relevanter Benutzerinformationen.