L’analisi dei dati e l’apprendimento automatico sono attualmente sempre più utilizzati e le aziende che tentano l’avventura affrontano anche problemi di integrazione in generale. Per affrontare queste sfide, Ibm ha ideato un framework open source per i modelli di apprendimento automatico. Si tratta di CodeFlare, costruito sulla base di Ray, un framework emergente di calcolo distribuito open source per le applicazioni di machine learning, che semplifica l’integrazione e la scalabilità efficiente di flussi di lavoro di big data e intelligenza artificiale sui cloud ibridi.
CodeFlare per il machine learning
CodeFlare semplifica l’integrazione, la scalabilità e l’accelerazione di complesse pipeline multi-step di analytics e machine learning sul multi-cloud ibrido. Per creare un modello di machine learning oggi, fanno sapere dall’Ibm, i ricercatori e gli sviluppatori devono prima addestrare e ottimizzare il modello. Questo potrebbe comportare la pulizia dei dati, l’estrazione delle caratteristiche e l’ottimizzazione del modello.
CodeFlare permette di semplificare questo processo utilizzando un’interfaccia basata su Python per quella che viene chiamata pipeline, rendendo più semplice l’integrazione, la parallelizzazione e la condivisione dei dati.
I vantaggi per i Data Scientist
L’obiettivo più importante del nuovo framework, dichiarano dalla società americana, è quello di unificare i flussi di lavoro della pipeline su più piattaforme senza che sia necessario, per i data scientist, imparare un nuovo linguaggio per il workflow.
CodeFlare implica anche che gli sviluppatori non debbano più duplicare i loro sforzi o faticare per capire cosa hanno fatto i colleghi in passato per far funzionare una certa linea di sviluppo. Con questo framework si intende dotare gli scienziati dei dati di strumenti più ricchi e API che possano utilizzare con più coerenza, permettendo loro di concentrarsi di più sulla loro effettiva ricerca piuttosto che sulla complessità di configurazione e deployment.
Le pipeline CodeFlare possono, infatti, essere elaborate con facilità sulla nuova piattaforma serverless Ibm Cloud Code Engine e Red Hat OpenShift. Gli utenti, in questa modalità, possono fare il deployment praticamente ovunque, e ciò accresce i vantaggi del serverless ai data scientist e ai ricercatori di intelligenza artificiale.
Il nuovo sistema di sviluppo rende anche più facile l’integrazione e il bridging con altri ecosistemi cloud-native, fornendo adattatori per event-trigger (come l’arrivo di un nuovo file), così come caricare e partizionare i dati da una vasta gamma di fonti, tipo gli storage a oggetti cloud, i data lake e i filesystem distribuiti.
Inoltre, CodeFlare, sottolineano i ricercatori di Ibm, può ridurre drasticamente anche il tempo per impostare, eseguire, scalare i test di machine learning.
Casi d’uso aziendali
CodeFlare ha il potenziale per affrontare l’emergere di flussi di lavoro convergenti, in cui intelligenza artificiale, analisi dei dati e modellazione sono intrecciate per fornire un time-to-value molto più rapido rispetto agli approcci tradizionali.
“Questi flussi di lavoro stanno emergendo in un’ampia gamma di domini aziendali. Ad esempio, la scoperta di farmaci, in cui queste complesse pipeline vengono applicate per regolare i protocolli di trattamento, la produzione e l’ottimizzazione della catena di approvvigionamento, in cui la modellazione e la simulazione dei processi sono accoppiati insieme per ottenere prestazioni significativamente migliori di quelle esistenti in base euristica”
ha dichiarato recentemente Priya Nagpurkar, direttore, piattaforma cloud ibrida presso IBM Research .
Un altro potenziale caso d’uso riguarda la progettazione di semiconduttori, “dove complesse pipeline di Machine Learning possono essere utilizzate per identificare i difetti del chip senza rallentare la produzione”.
Comments are closed.