Nel campo dell’intelligenza artificiale, gli Small Language Models stanno conoscendo una crescente popolarità proprio per le loro caratteristiche premianti, che li rendono più convenienti in diversi campi rispetto ai Large Language Models. Il loro pregio è l’efficienza. Richiedono meno risorse di calcolo e di archiviazione rispetto agli LLM, costituendo una soluzione più pratica per molte applicazioni che richiedono elaborazione in tempo reale o distribuzione su dispositivi edge con risorse limitate. Pertanto, riducendo le dimensioni e la complessità del modello, gli sviluppatori possono ottenere tempi di inferenza più rapidi, latenza inferiore e prestazioni migliorate. Così, i modelli di piccole dimensioni si rivelano ideali per ambienti con risorse limitate come telefoni cellulari, computer personali o dispositivi connessi.

Essi sono in grado di fornire un’alternativa praticabile agli LLM per sviluppare soluzioni di intelligenza artificiale generativa ad alte prestazioni, convenienti e sicure.

In futuro, questa tendenza “small” aumenterà, per vari motivi. Uno di questi è la crescita esponenziale dell’AI, che ha effetti collaterali in termini economici, oltre che in termini di consumi energetici e di impatto emissivo. Secondo IDC, la spesa per GenAI, che già nel 2024 è più che raddoppiata, raggiungendo i 40,1 miliardi di dollari, si prevede che oltrepasserà i 151 miliardi di dollari nel 2027. Si tratta di cifre impressionanti. Urgono soluzioni più “compatte”, gli SLM possono fornire un contributo importante.

Cosa sono gli Small Language Models

Small Language Models sono modelli di intelligenza artificiale in grado di elaborare, comprendere e generare contenuti in linguaggio naturale. Si tratta di una soluzione di Generative AI simile a un LLM, ma con dimensioni notevolmente ridotte. I parametri SLM variano da 500 milioni a 20 miliardi; per gli LLM si va da un centinaio di miliardi a oltre mille miliardi.

Gli SLM, come i loro “fratelli maggiori” sono in grado di comprendere e generare il linguaggio naturale e sono costruiti utilizzando versioni semplificate delle reti neurali artificiali presenti nei Large Language Models.

Sono progettati per essere utilizzati dalle aziende per attività più piccole e specializzate che non richiedono enormi set di dati. Questi potrebbero includere chatbot di assistenza clienti specifici per un dato prodotto o modelli per analizzare le tendenze di mercato. Inoltre, sono utili nei casi in cui i dati interni sono sensibili e devono rimanere all’interno dell’azienda, ad esempio nel settore finanziario o sanitario.

Il futuro è nel segno degli SLM

Secondo Gartner, uno dei trend futuri sarà l’aumento della domanda per modelli GenAI specifici per dominio. Questo è un fattore che avvantaggia l’impiego degli Small Language Models. Come rileva la stessa società di ricerca e analisi:

“Sebbene i modelli generici funzionino bene in un’ampia gamma di applicazioni, la domanda di GenAI sta aumentando in molti settori. In combinazione con una maggiore disponibilità di modelli di linguaggio di grandi dimensioni open source ad alte prestazioni e commercialmente utilizzabili, c’è un appetito per modelli specifici per dominio. Entro il 2027, oltre il 50% dei modelli GenAI utilizzati dalle aziende sarà specifico per un settore o una funzione aziendale, rispetto a circa l’1% nel 2023”.

Nel dicembre 2024, Microsoft ha rilasciato l’ultimo SLM della sua famiglia Phi, Phi-4 , che secondo l’azienda “supera modelli comparabili e più grandi nel ragionamento matematico” oltre a essere in grado di eseguire l’elaborazione del linguaggio convenzionale. Per l’azienda, gli SLM offrono vantaggi quali: tempi di formazione e risposta più rapidi, un consumo energetico ridotto, grazie alla architettura più piccola, un elevato rapporto costi-benefici. A ciò si aggiungono prestazioni migliorate in attività specifiche di dominio: gli SLM possono essere adattati ad applicazioni specifiche, offrendo potenzialmente una maggiore precisione in domini ristretti.

SLM e LLM: quando scegliere gli uni o gli altri

Detto questo, gli Small Language Models non possono sostituire gli LLM. Ci sono ambiti in cui i Large Language Models sono ancora preferibili, per esempio, per attività complesse che richiedono una profonda comprensione contestuale e ampie capacità di generalizzazione, in genere a un costo più elevato con maggiori requisiti di risorse.

Gli SLM, invece, sono ideali per applicazioni specializzate e con risorse limitate, offrendo capacità di distribuzione rapide ed economiche.

Comments are closed.