Oracle annonce la disponibilité générale de MySQL HeatWave Lakehouse
juillet 2023 par Marc Jacob
Oracle annonce la disponibilité générale de MySQL HeatWave Lakehouse, une nouveauté dans l’industrie qui permet aux clients d’interroger les données du stockage objet aussi rapidement que celles des bases de données. MySQL HeatWave Lakehouse supporte une diversité de formats de fichiers de stockage d’objets tels que le CSV ou Parquet, ainsi que les fichiers d’exportation d’autres bases de données. Il peut combiner les données des fichiers de stockage d’objets avec les données transactionnelles de la base de données MySQL dans une même requête. Les fichiers de stockage d’objets sont interrogés directement par HeatWave sans copier les données dans la base de données MySQL. MySQL HeatWave Lakehouse établit ainsi de nouvelles normes en matière d’évolutivité et de performance pour le traitement des requêtes, la vitesse de chargement des données, le temps de provisionnement des clusters et l’automatisation de l’interrogation des données dans le stockage d’objets.
L’interrogation des données dans le stockage d’objets est aussi rapide que dans la base de données
Comme démontré par un test de performances TPC-H* de 10 To, l’interrogation des données dans le stockage d’objets dans des formats de fichiers courants avec MySQL HeatWave Lakehouse est aussi rapide que dans la base de données MySQL. Cela est rendu possible par MySQL Autopilot, une fonctionnalité intégrée de MySQL HeatWave qui fournit une automatisation alimentée par le machine learning, afin de tirer parti de l’exécution des requêtes et d’améliorer le plan d’exécution des futures requêtes. MySQL Autopilot est une innovation de MySQL HeatWave qui n’est disponible nulle part ailleurs. MySQL HeatWave sur Oracle Cloud Infrastructure (OCI) est alimenté par des processeurs AMD EPYCTM.
Comme le démontre un test d’évaluation TPC-H* de 500 To, les performances de requête de MySQL HeatWave Lakehouse sont les suivantes :
• 9 fois plus rapides qu’Amazon Redshift
• 17 fois plus rapides que Snowflake
• 17 fois plus rapides que Databricks
• 36 fois plus rapides que Google BigQuery
Les performances de chargement des données à partir du dépôt d’objets avec MySQL HeatWave Lakehouse sont les suivantes :
• 9 fois plus rapides qu’Amazon Redshift
• 2 fois plus rapides que Snowflake
• 6 fois plus rapides que Databricks
• 8 fois plus rapides que Google BigQuery
Les performances inégalées de MySQL HeatWave sont le résultat de son architecture évolutive qui permet un parallélisme massif pour provisionner le cluster, charger les données et traiter les requêtes jusqu’à 512 nœuds. En outre, les améliorations apportées à MySQL Autopilot automatisent la création de métadonnées pour les fichiers d’objet et s’adaptent dynamiquement aux performances du dépôt d’objets sous-jacent pour fournir les meilleures performances dans toutes les régions d’OCI.
MySQL HeatWave est le seul service cloud qui fournit le traitement des transactions, l’analyse en temps réel, le machine learning, les requêtes de data lake et l’automatisation alimentée par le machine learning au sein d’un seul service de base de données MySQL. Élément essentiel de la stratégie cloud distribuée d’Oracle, MySQL HeatWave est disponible dans OCI, en mode natif sur Amazon Web Services, dans le cadre d’Oracle Database Service for Azure et dans les data centers des clients avec OCI Dedicated Region.
« Les données augmentent de manière exponentielle, tout comme la quantité de données que nous stockons dans notre data lake. La possibilité d’utiliser la syntaxe standard MySQL pour interroger des données dans notre base de données et notre stockage d’objets afin d’obtenir des informations en temps réel est très importante pour Natura. », affirme Fabricio Rucci, Architecte de solutions chez Natura&Co. « Cela ouvre de nouvelles opportunités d’exploration et pourrait représenter de nouveaux avantages défiant toute concurrence si nous pouvons analyser toutes ces données plus rapidement que n’importe qui. »
« HeatWave Lakehouse s’adapte très bien au chargement de données à partir du stockage d’objets et à l’exécution de requêtes sur la banque d’objets. », explique Henry Tullis, Leader de l’infrastructure cloud et de l’ingénierie chez Deloitte Consulting. « Le temps de chargement et les temps de requête sont presque constants à mesure que la taille des données augmente, proportionnellement à celle du cluster HeatWave. Cette caractéristique d’augmentation de HeatWave Lakehouse pour la gestion des données est essentielle pour traiter efficacement de très grandes quantités de données. »
« Depuis que le big data existe, il est évident que les requêtes big data / lakehouse sont beaucoup plus lentes que les requêtes transactionnelles. », explique Holger Mueller, Vice-Président et Analyste principal chez Constellation Research. « MySQL HeatWave change la donne. Lakehouse peut atteindre des performances identiques aux requêtes de transaction, ce qui était jusqu’à lors totalement inimaginable. Avec la parité des performances de requête, HeatWave permet à CxOs de ne plus se soucier de l’emplacement des données et de la manière de les interroger. L’ingrédient secret est l’Autopilot de HeatWave qui optimise les requêtes. L’équipe HeatWave réalise encore une première. »