LLM: nuovi approcci al training con l’uso di dati personalizzati
Gli LLM non sono più solo ‘simulatori di Internet’. La formazione dei modelli si sta evolvendo grazie all’uso di dati sintetici e non pubblici. Il recente rapporto tecnico di Microsoft su Phi-3 è un esempio di successo nell’uso di dati sintetici di alta qualità. Inoltre, aziende come OpenAI stanno investendo miliardi per creare nuovi insiemi di dati con l’aiuto di professionisti specializzati. Questo cambiamento sta permettendo agli LLM di eccellere in campi dove i dati web sono carenti, dimostrando potenzialità che vanno oltre la simulazione del contenuto online.