Meta lancia Chameleon: modello AI misto per testo e immagini

Meta rilascia Chameleon, modello AI misto per testo e immagini, valutato superiore a GPT-4. An AI model learning from both text and image inputs, represented as interconnected digital tokens and visual cues.

Meta ha svelato Chameleon, un modello AI misto che comprende e genera contenuti sia testuali che visivi. In test comparativi, Chameleon ha superato GPT-4 nel 51,6% dei casi e Gemini Pro nel 60,4% dei casi. A differenza di altri modelli misti, Chameleon utilizza una rappresentazione unica a token per testo e immagini. Sono stati sviluppati due modelli: Chameleon-7B (7 miliardi di parametri) e Chameleon-34B (34 miliardi di parametri). Entrambi i modelli sono stati pre-addestrati su oltre 4 trilioni di token di dati misti e poi perfezionati per sicurezza e allineamento. Chameleon ha ottenuto risultati all’avanguardia in benchmark di risposte visive a domande e didascalie di immagini. La formazione del modello ha richiesto modifiche all’architettura Transformer a causa di instabilità durante la scalabilità.

Potrebbe interessarti anche...