Machine learning. Microsoft annuncia libreria open source per Apache Spark

Microsoft dichiara che le API di MMLSpark consentiranno ai data scientist di abbattere i tempi di sviluppo di codice per applicazioni di analisi delle immagini e computer vision.

Microsoft rende disponibile una libreria open source orientata al machine learning e dedicata agli utilizzatori di Apache Spark, il più veloce framework computazionale in cluster attualmente sul mercato, sviluppato presso l’AMPLab di Berkeley. L’obiettivo è quello di risolvere alcuni problemi di indicizzazione riscontrati dagli utenti e colmare una lacuna che attualmente rallenta il lavoro dei data scientist.

La nuova libreria, denominata MMLSpark, semplifica notevolmente molte delle attività più ripetitive e rende disponibile un insieme di algoritmi per la costruzione di modelli in PySpark. «MMLSpark supporta Dataframes − il formato con cui sono organizzati i dati in Spark, NdA – e si integra con le pipeline di SparkML per garantire componibilità e modularità», scrivono in un post Roope Astala e Sudarshan Raghunathan, responsabili del progetto per Microsoft.

Una delle principali caratteristiche di MMLSpark è la disponibilità di una rete neurale. La libreria, ad esempio, può analizzare un set di immagini e inviare le informazioni risultanti ad un algoritmo di machine learning. Microsoft dichiara che le API di MMLSpark consentiranno ai data scientist di abbattere i tempi di sviluppo di codice per applicazioni di analisi delle immagini e computer vision, grazie anche all’implementazione di algoritmi per la preparazione e la trasformazione dei dati numerici di base.

Fonte: OpenSourceForU.com