KI-Update kompakt: DrEureka, MAI-1, SearchGPT, YouTube

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

In Pocket speichern vorlesen Druckansicht 1 Kommentar lesen

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 8 Min.
Von
Inhaltsverzeichnis

Die Übertragung von in der Simulation gelernten Roboterfähigkeiten in die reale Welt, bekannt als Sim-to-Real-Transfer, ist ein vielversprechender Ansatz für die Entwicklung von Roboterfähigkeiten in großem Maßstab. Bislang erfordert dieser Prozess jedoch viel manuelle Arbeit, wie etwa das Entwerfen von Belohnungsfunktionen und das Einstellen von Simulationsparametern, insbesondere im Prozess der sogenannten Domänenrandomisierung.

Dabei werden physikalische Parameter in der Simulation zufällig variiert, um eine robuste Steuerung zu entwickeln, die auch bei Störungen in der echten Welt noch funktioniert. Das jedoch benötigt ein gutes Verständnis der Physik, zum Beispiel welchen Einfluss die Reibung auf verschiedenen Oberflächen auf die Fortbewegung eines Roboters hat. Die menschlichen Experten benötigen auch Kenntnisse des spezifischen Robotersystems.

Mit DrEureka schlägt ein Team von Forschern der University of Pennsylvania, Nvidia und UT Austin nun vor, die Auswahl der richtigen Parameterverteilung für die Domänenrandomisierung mithilfe von KI-Sprachmodellen zu verbessern – denn die verfügen über ein breites physikalisches Wissen und die Fähigkeit, Hypothesen zu generieren.

DrEureka nutzt dieses physikalische Wissen und die Optimierungsfähigkeiten des Sprachmodells, um passende Trainingsparameter zu finden und robuste Roboterfähigkeiten zu entwickeln. In Experimenten mit Lauf- und Greifrobotern übertrafen die DrEureka-trainierten Roboterfähigkeiten, die manuell entwickelten deutlich. Ein Roboter lernte sogar, minutenlang auf einem Yogaball zu balancieren.

Insgesamt zeigen die Forscher mit ihrer Arbeit das große Potenzial, das Modelle wie GPT-4 für die Automatisierung des Sim-to-Real-Transfers bieten. Als Nächstes will das Team die Auswahl der richtigen Parameter dynamisch während des Trainings anpassen.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Microsoft arbeitet Medienberichten zufolge an einem leistungsstarken hauseigenen KI-Sprachmodell, das mit den Modellen von Google und OpenAI mithalten soll. Das intern als MAI-1 bezeichnete Projekt wird von Mustafa Suleyman geleitet, dem Mitgründer von Google DeepMind.

Mit geschätzten 500 Milliarden Parametern wäre MAI-1 deutlich komplexer als Microsofts bisherige Open-Source-Modelle, aber kleiner als OpenAIs GPT-4. Für das Training stellt Microsoft umfangreiche Serverkapazitäten und Datenmengen bereit. Der genaue Anwendungszweck hängt von der Leistungsfähigkeit des fertigen Modells ab. Eine Vorstellung auf der Microsoft-Entwicklerkonferenz Ende Mai gilt als möglich.

Microsoft investierte Milliarden in OpenAI und nutzt deren Technik, geriet aber in Konflikt mit OpenAI-CEO Sam Altman. Dieser wurde vorübergehend entlassen, kehrte jedoch zurück. Microsoft erhielt lediglich einen Beobachterposten ohne Stimmrecht bei OpenAI.

Stack Overflow und OpenAI haben eine Partnerschaft im Bereich der Künstlichen Intelligenz angekündigt. Das Ziel ist es, die Qualität von KI-generiertem Code zu verbessern und gleichzeitig die Nutzung urheberrechtlich geschützter Inhalte durch KI-Chatbots zu adressieren.

Im Rahmen der Kooperation erhält OpenAI Zugriff auf die API von Stack Overflow, um mit den geprüften Daten KI-Modelle zu trainieren und Nutzerfragen direkt zu beantworten. Im Gegenzug bekommt Stack Overflow Zugang zur KI-Technik von OpenAI für die Weiterentwicklung des eigenen KI-Assistenten OverflowAI.

Eine interne Studie von Stack Overflow hatte gezeigt, dass nur 42 Prozent der befragten Entwickler der Genauigkeit von KI-generiertem Code vertrauen. Die Partnerschaft betont daher mehrfach die angestrebte Qualitätsverbesserung durch das Training mit korrektem Code.

Stack Overflow plant außerdem, die eigene API für KI-Anbieter kostenpflichtig zu machen, um dem befürchteten Rückgang der Nutzerzahlen durch KI-Assistenten entgegenzuwirken.

Einem Leak zufolge befindet sich OpenAI in den letzten Zügen vor dem Release ihrer internen Suchmaschine "Sonic", die unter dem Namen "SearchGPT" auf den Markt kommen soll. Die Enthüllung stammt vom Webentwickler Tibor Blaho, der regelmäßig den Quellcode von OpenAI analysiert und in der Vergangenheit bereits mehrfach unangekündigte Funktionen im Voraus aufdecken konnte.

SearchGPT wird voraussichtlich eine Text- und Bildersuche, diverse Informations-Widgets sowie die Option für Folgeprompts bereitstellen. Die Präsentation der Suchergebnisse erfolgt in einem mit ChatGPT vergleichbaren Chatfenster, ergänzt durch Widgets für Wetter, Taschenrechner, Sport und Finanzen am oberen Bildschirmrand. Bemerkenswert ist die Beschränkung von Webseitenzusammenfassungen auf maximal 300 Zeichen, was möglicherweise der Debatte um unerlaubte Inhaltsnutzung und Trafficverluste für Webseitenbetreiber entgegenwirken soll.

Als Sprachmodell für SearchGPT kommt laut Blaho womöglich ein neues Modell namens GPT-4 Lite zum Einsatz. Bei GPT-4 Lite könnte es sich um das kürzlich in der Chatbot-Arena anonym getestete GPT2-Chatbot-Modell handeln. Dass OpenAI an einer Sprachmodell-basierten Suchmaschine arbeitet, deutete CEO Sam Altman bereits mehrfach an und wurde im Februar auch von The Information berichtet. SearchGPT könnte – so spekuliert Blaho – noch vor Googles großer KI-Entwicklermesse Google I/O am 14. Mai vorgestellt werden.

OpenAI präsentiert die Fähigkeiten seiner Video-KI Sora in einem neuen Ausschnitt. Darin führen vier unterschiedliche Figuren, darunter ein Roboter und ein älterer Herr, synchron die gleichen Bewegungen aus. Das Unternehmen betont, dass alle Segmente ausschließlich mit Sora erstellt und nicht nachbearbeitet wurden.

Die Veröffentlichung erfolgt kurz nachdem das Kreativstudio Shy Kids Einblicke in ihre Arbeit mit Sora gab. Für ihr Video "Air Head" mussten sie trotz beeindruckender Ergebnisse viele manuelle Anpassungen vornehmen, etwa an Farben und Bildqualität. OpenAI hebt nun hervor, dass Sora einzelne Elemente eines Videos gezielt ändern kann, wie hier die Personen.

Wann Sora für die Öffentlichkeit verfügbar sein wird, bleibt offen. CTO Mira Murati kündigte eine Veröffentlichung für dieses Jahr an, nannte aber kein konkretes Datum.

Unternehmen, Organisationen und Behörden möchten Künstliche Intelligenz einsetzen. Allerdings wirft der Einsatz der großen Sprachmodelle rechtliche Fragen auf. Das betrifft unter anderem einen DSGVO-konformen Einsatz. Daher hat die deutsche Datenschutzkonferenz einen Leitfaden für Unternehmen herausgebracht. Dieser eignet sich zwar auch für andere KI-Modelle, bezieht sich aber konkret auf Sprachmodelle.

Aufgeteilt ist der Leitfaden in drei Bereiche: die ausgewählten Einsatzfelder und Zwecke der KI-Anwendungen, die Implementierung und die Nutzung. Die Datenschutzkonferenz schickt sich zugleich an, die Überwachung des AI Acts der Europäischen Union in Deutschland zu übernehmen: "Die Datenschutzaufsichtsbehörden sind bereit, die Aufgabe der nationalen Marktüberwachung für KI-Systeme zu übernehmen", heißt es in einem zweiten Papier. Die Expertise im digitalen Grundrechtsschutz könne auf diese Kompetenz ausgeweitet werden. Der Leitfaden ist als PDF verfügbar.

Apple-CEO Tim Cook glaubt an generative KI und verwies auf beträchtliche Investitionen in diesem Bereich. Laut einem Bericht des Wall Street Journal scheint ein Teil der Investitionen auch in die Hardware zu fließen: Apple arbeitet demnach an der Entwicklung eines spezialisierten Chips für den Einsatz Künstlicher Intelligenz in den eigenen Rechenzentren. Das unter dem Codenamen "Project ACDC" geführte Vorhaben zielt darauf ab, die Expertise des Unternehmens im Chipdesign für die Serverinfrastruktur zu nutzen. Der Fokus des Chips liegt auf der Ausführung von KI-Modellen, weniger auf dem Training.

In enger Zusammenarbeit mit dem taiwanischen Halbleiterhersteller TSMC soll der Chip entworfen und produziert werden. Einzelheiten zu einer möglichen Vorstellung oder Markteinführung sind bislang nicht bekannt.

YouTube experimentiert mit einer neuen KI-gestützten Funktion namens "Jump Ahead", die Nutzern dabei helfen soll, in Videos direkt zu den interessantesten Stellen zu gelangen. Die Funktion kombiniert Daten über das bisherige Zuschauerverhalten mit KI-Algorithmen, um vorherzusagen, zu welcher Sequenz der Nutzer springen möchte.

Derzeit befindet sich "Jump Ahead" noch in der Testphase und ist ausschließlich für Premium-Abonnenten in den USA verfügbar, die die Android-App nutzen. Die Aktivierung erfolgt über die Seite youtube.com/new. Nach einem Doppeltap zum Vorspulen kann die Option "Jump Ahead" erscheinen.

Mit diesem Feature möchte YouTube das Nutzererlebnis verbessern und gleichzeitig die Serverbelastung durch das Überspringen uninteressanter Passagen reduzieren. Es reiht sich ein in eine Reihe von KI-Werkzeugen, die YouTube in jüngster Zeit zur Unterstützung der Videoproduktion eingeführt hat, darunter "YouTube Create" und "Dream Screen".

Podcast: KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

(igr)