Snapchat teilt neue Forschungsergebnisse über schnellere Generative AI-Verarbeitungsgeschwindigkeiten mit

Snapchat möchte die Reaktionszeit der generativen KI-Bildgenerierung beschleunigen und präsentiert dazu einen neuen Ansatz, der ein schnelleres Modell für die Erstellung von Bildern basierend auf Textanfragen bietet.

Schnellere Generative AI-Verarbeitung

Dies dürfte nicht unbedingt als ein Hauptproblem bei der Nutzung angesehen werden. Die meisten generativen KI-Tools benötigen derzeit vielleicht etwa 30 Sekunden, um solche Bilder zu generieren, selbst auf mobilen Geräten. Aber Snap sagt, dass sein neues System ähnliche Bilder in weniger als zwei Sekunden erzeugen kann – was zwar keine bahnbrechende Veränderung darstellt, aber eine interessante Entwicklung im weiteren Kontext des generativen KI-Prozesses ist.

Wie von Snap erklärt:

„SnapFusion verkürzt die Modellausführungszeit von der Texteingabe bis zur Bildgenerierung auf mobilen Geräten auf weniger als zwei Sekunden – die bisher schnellste in der akademischen Gemeinschaft veröffentlichte Zeit. Snap Research hat diesen Durchbruch durch die Optimierung der Netzwerkarchitektur und des Rauschunterdrückungsvorgangs erreicht, wodurch die Effizienz unglaublich hoch ist, während die Bildqualität erhalten bleibt. Nun ist es möglich, das Modell zur Generierung von Bildern basierend auf Texteingaben auszuführen und klare und scharfe Bilder in wenigen Sekunden auf Mobilgeräten anstatt in Minuten oder Stunden zu erhalten, wie es andere Forschungen darstellen.“

Hier sind einige Beispiele für die von der SnapFusion-Methode erzeugten Visuals, die immer noch wie die gleiche Art von generativen KI-Bildern aussehen, die man von jeder anderen App bekommt (also ziemlich nah dran, aber irgendwie merkwürdig). Aber sie wurden dem Benutzer viel schneller zurückgegeben, was laut Snap mehrere Vorteile haben könnte.

Vorteile der neuen Methode

Eine verbesserte Benutzererfahrung ist ein Faktor, aber Snap weist auch darauf hin, dass der neue Prozess die Privatsphäre verbessern könnte, indem der Datenaustausch mit Dritten begrenzt wird, während gleichzeitig die Verarbeitungskosten für Entwickler reduziert werden.

Obwohl die Forschung von Snap einige Einschränkungen enthält, einschließlich der Tatsache, dass die meisten Experimente auf einem iPhone Pro 14 durchgeführt wurden, das laut Snap „mehr Rechenleistung hat als viele andere Telefone“. Daher ist es wahrscheinlich fraglich, ob ein Smartphone, das nicht dem Standard des iPhone Pro 14 entspricht, diese Geschwindigkeitsvorgaben erfüllen kann. Aber es wird trotzdem wahrscheinlich schneller sein als aktuelle Systeme. Snap hat eine umfassende Übersicht über „Rauschunterdrückung“ sowie zu viele mathematische Gleichungen in seinem vollständigen Artikel über den Prozess zur Verfügung gestellt, den Sie hier herunterladen können.

Es handelt sich um ein interessantes Experiment, das auch auf die Zukunft der generativen KI hinweist, die letztendlich in der Lage sein wird, in Echtzeit auf Benutzerhinweise zu reagieren. Dies könnte eine Vielzahl neuer Nutzungsoptionen ermöglichen, wie beispielsweise Echtzeit-Übersetzung, zunehmend reaktionsschnelle Erstellung und mehr.

Quelle