Hadoop* au secours de l'analyse des données de production pharmaceutique...
La société Merck utilise Hadoop* pour analyser des quantités importantes de données dans le cadre du développement de nouveaux vaccins.
Afin de comprendre les causes de rendements anormaux de production et d'éviter l'utilisation de tableur dans l'analyse de données provenant de plusieurs sources (Scada historian, logiciel de maintenance, système de monitoring...), Merck a eu recours à une application d'analyse de données construite sur une distribution Hadoop Hortonworks mise en oeuvre sur la plateforme Cloud Amazon.
Celle-ci a permis de mettre en évidence, après 15 milliards de calcul et plus de 5,5 millions de comparaisons de lot à lot, le caractère critique d'une étape de purification vis à vis du rendement final de production.
D'après Merck, cette nouvelle approche d'analyse de données permet un gain significatif dans la recherche de performance industrielle.
Plus d'information ici.
* Hadoop est un framework Java libre destiné à faciliter la création d'applications distribuées et échelonnables (scalables). Il permet aux applications de travailler avec des milliers de nœuds et des pétaoctets de données.
Afin de comprendre les causes de rendements anormaux de production et d'éviter l'utilisation de tableur dans l'analyse de données provenant de plusieurs sources (Scada historian, logiciel de maintenance, système de monitoring...), Merck a eu recours à une application d'analyse de données construite sur une distribution Hadoop Hortonworks mise en oeuvre sur la plateforme Cloud Amazon.
Celle-ci a permis de mettre en évidence, après 15 milliards de calcul et plus de 5,5 millions de comparaisons de lot à lot, le caractère critique d'une étape de purification vis à vis du rendement final de production.
D'après Merck, cette nouvelle approche d'analyse de données permet un gain significatif dans la recherche de performance industrielle.
Plus d'information ici.
* Hadoop est un framework Java libre destiné à faciliter la création d'applications distribuées et échelonnables (scalables). Il permet aux applications de travailler avec des milliers de nœuds et des pétaoctets de données.