Fivetran annonce la prise en charge d’Amazon Simple Storage Service
avril 2023 par Marc Jacob
Fivetran annonce la prise en charge d’Amazon Simple Storage Service (Amazon S3) avec le format de Data Lake Apache Iceberg. Amazon S3 est un service de stockage de données d’Amazon Web Services (AWS) qui offre une évolutivité, une disponibilité des données, une sécurité et des performances de premier ordre. Apache Iceberg est un format de données open-source largement supporté qui offre des transactions algorithmiques, cohérentes, isolées et durables (ACID) pour les data lakes. Fivetran est une plateforme automatisée de transfert de données qui anonymise les informations personnelles identifiables (PII) tout en nettoyant, normalisant et chargeant automatiquement les données dans le Data Lake.
Grâce à une capacité de stockage étendue et à la prise en charge de plusieurs formats de données, le Data Lake est une solution très prisée par les équipes qui effectuent des analyses sur des ensembles massifs de données ou qui mènent des projets de Data Science de grande envergure qui contribuent à l’activité de l’entreprise. Des centaines de milliers de data lakes fonctionnent sur Amazon S3 et, parmi les nombreuses équipes des entreprises qui les ont déjà mis en œuvre, une majorité cite l’amélioration de l’agilité de l’entreprise, l’amélioration du développement de produits et de services, ainsi que l’amélioration du service et de l’engagement des clients comme des avantages des data lakes.
À mesure que les enterprises continuent de tirer parti des data lakes pour exécuter des analyses et extraire des informations de leurs données, les équipes de Marketing Intelligence progressistes en demandent davantage, et des solutions telles qu’Amazon S3 et la prise en charge des pipelines automatisés répondent à cette demande. Tinuiti, l’une des plus grandes entreprises indépendantes de marketing à la performance, traite quotidiennement d’importants volumes de données et doit disposer d’un data lake - Amazon S3 en particulier - pour alimenter le potentiel de la marque de ses clients.
Au lieu de se focaliser sur toutes les étapes manuelles nécessaires pour ingérer les données, les nettoyer, les préparer à l’utilisation, hacher et bloquer les données sensibles, puis commencer à les interroger, les entreprises modernes voient une grande valeur dans la réduction des efforts de gestion du data lake grâce à l’automatisation des pipelines et à la gouvernance.