Snowflake Data Cloud présente les dernières innovations
juin 2021 par Marc Jacob
Le Snowflake Data Cloud présente les dernières innovations qui redéfinissent ce qu’il est possible de faire avec le Data Cloud. Lors de son congrès annuel Snowflake Summit qui se déroule du 8 au 10 juin 2021, l’entreprise a annoncé des innovations en matière de programmabilité des données, de gouvernance globale et d’optimisation des plateformes, afin de permettre aux entreprises de rassembler davantage de données dans le Data Cloud et d’obtenir une valeur plus importante des données ainsi que des informations commerciales puissantes.
Innovations en matière de programmabilité des données :
Snowpark. Avec une prise en charge initiale de Java et Scala, l’expérience de développement de Snowflake, Snowpark, permet aux data engineers, aux data scientists et aux développeurs de construire des applications autour des données en utilisant leur langage préféré et des concepts de programmation familiers, puis d’exécuter ces charges de travail directement dans Snowflake. Actuellement en preview privée, Snowpark sera bientôt disponible en preview publique.
UDF Java. Grâce aux fonctions définies par l’utilisateur (UDF) de Java, les clients peuvent intégrer leur code personnalisé et leur logique d’entreprise à Snowflake pour obtenir de meilleures performances et des cas d’utilisation avec des capacités étendues, tout en réduisant la complexité de la gestion. Actuellement en preview privée, UDF Java sera bientôt disponible en preview publique.
Données non structurées. Snowflake accélère la valorisation des données non structurées, en permettant aux clients de stocker, de gérer, de traiter et de partager des données de fichiers parallèlement à leurs données structurées et semi-structurées, et de débloquer de nouvelles opportunités de revenus. Actuellement en preview privée, la prise en charge des données non structurées sera bientôt disponible en preview publique.
API SQL. L’API SQL de Snowflake permet aux applications personnalisées et prêtes à l’emploi d’appeler Snowflake directement via une API REST, sans avoir besoin de pilotes côté client, ce qui réduit la complexité et les frais généraux d’administration. L’API SQL est disponible en version publique.
En plus de ses innovations fondamentales, Snowflake continue d’étendre et d’approfondir son écosystème de partenaires. Le nouveau programme Snowpark Accelerated fournit aux partenaires qui s’intègrent à Snowpark un accès aux experts techniques et une exposition supplémentaire. Les partenaires dans le domaine de la data science tels que Dataiku et DataRobot continuent également d’améliorer leurs intégrations avec Snowflake. En outre, Amazon Web Services (AWS) a lancé l’intégration de Snowflake avec Amazon SageMaker Data Wrangler. À partir d’aujourd’hui, les entreprises peuvent utiliser Snowflake comme source de données dans Amazon SageMaker Data Wrangler pour préparer facilement les données dans Snowflake pour l’apprentissage automatique.
Capacités de gouvernance mondiale :
Classification. La capacité de classification de Snowflake détecte automatiquement les informations personnelles identifiables (PII) dans un tableau et exploite le cadre de balisage pour annoter les informations, ce qui permet d’utiliser des politiques basées sur les rôles pour contrôler l’accès aux données. La classification est en preview privée.
Vues anonymisées. Cette nouvelle fonctionnalité peut être utilisée pour protéger la vie privée et l’identité dans un ensemble de données, tout en conservant sa valeur analytique. L’aperçu privé des vues anonymes devrait être publié prochainement.
Optimisations de la plateforme :
Amélioration des coûts du stockage. Des modifications récentes de la représentation des données dans Snowflake ont permis une meilleure compression et une réduction des coûts de stockage. Cette technologie de stockage améliorée est disponible de manière transparente, sans action de l’utilisateur, sans modification de la configuration et sans changement d’application ou de requête. Elle est déjà déployée pour tous les clients
Snowflake et s’appliquera aux données nouvellement écrites.
Prise en charge améliorée des expériences interactives. Le nouvel ensemble de mises à jour publiées pour les exigences des charges de travail à volume élevé et à faible latence peut améliorer d’un facteur 6 le débit des requêtes sur un seul cluster de calcul et diviser par 8 la durée moyenne des requêtes pour ces charges de travail. Ces améliorations sont en preview privée.
Tableau de bord d’utilisation. Le nouveau tableau de bord d’utilisation aide les clients à mieux comprendre l’utilisation et les coûts de la plateforme, ce qui facilite la gestion des comptes Snowflake dans toute l’entreprise. Le tableau de bord d’utilisation est en preview publique.