Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

Vous avez peut-être vu la scène remarquable de “I Love Lucy”, où Lucy et Ethel débarquent en enfermant des chocolats près d’une usine de fabrication de bonbons. La ligne de transport rapide s’allume et les femmes sont rapidement sorties de leur profondeur. Avant la fin de la scène, elles remplissent leurs casquettes, leurs poches et leurs bouches de chocolats, tandis qu’un défilé de desserts non emballés s’éloigne sans cesse de leur poste. C’est drôle. C’est aussi l’idéal simple pour comprendre l’immensité du pipeline d’informations avancées.

La progression effective de l’information d’un domaine à l’autre – d’une application SaaS à un centre de distribution de l’information, par exemple – est l’une des activités les plus fondamentales de l’entreprise actuelle axée sur l’information. Tout bien considéré, un examen utile ne peut pas commencer tant que l’information n’est pas accessible. Le flux d’informations peut être problématique, compte tenu du fait qu’un grand nombre de choses peuvent mal tourner pendant le transport d’un cadre à l’autre : l’information peut être souillée, elle peut se heurter à des goulots d’étranglement (provoquant l’inactivité), ou les sources d’information peuvent s’affronter et produire des copies. Au fur et à mesure que la complexité des besoins se développe et que la quantité de sources d’information se dédouble, ces problèmes prennent de l’ampleur et produisent des effets.

Le pipeline de l’information : travailler pour la compétence

Entrez dans le pipeline de l’information, une programmation qui dispense de nombreuses étapes manuelles de la procédure et permet un flux d’information fluide et robotisé, d’une station à l’autre. Il commence par caractériser le quoi, le où et le comment des informations sont recueillies. Il mécanise les procédures engagées pour séparer, modifier, consolider, approuver et empiler les informations en vue d’une enquête et d’une perception plus approfondies. Elle donne de la vitesse du début à la fin en supprimant les gaffes et en luttant contre les goulots d’étranglement ou l’oisiveté. Il peut traiter immédiatement de nombreux flux d’informations. Il s’agit donc d’une nécessité absolue pour l’entreprise actuelle axée sur l’information.

En quoi un pipeline d’informations n’est-il pas tout à fait la même chose que l’ETL ?

Vous pouvez généralement entendre les termes ETL et pipeline d’information utilisés de manière réciproque. ETL représente Concentration, Changement et Fardeau. Les cadres ETL extraient l’information d’un cadre, modifient l’information et la chargent dans une base de données ou un centre de distribution de l’information. Les pipelines ETL patrimoniaux fonctionnent normalement par groupes, ce qui implique que l’information est déplacée en une seule énorme masse à un moment donné vers le cadre objectif. Cela se produit généralement dans les périodes intermédiaires réservées habituelles ; par exemple, vous pouvez concevoir les groupes de manière à ce qu’ils fonctionnent à 12h30 de manière constante lorsque le trafic du cadre est faible.

Paradoxalement, “pipeline d’information” est un terme plus large qui inclut l’ETL comme sous-ensemble. Il fait allusion à un cadre permettant de faire circuler l’information d’un cadre à l’autre. Les informations peuvent éventuellement être modifiées, et elles peuvent être traitées progressivement (ou en jaillissant) plutôt que par lots. Au moment où l’information est diffusée, elle est traitée dans un flux continu, ce qui est utile pour les informations qui nécessitent un rafraîchissement constant, par exemple, les informations provenant d’un capteur observant le trafic. De plus, les informations ne peuvent pas être empilées dans une base de données ou une réserve d’informations. Elles peuvent être empilées sur un nombre quelconque de cibles, par exemple, un seau AWS ou un lac d’information, ou elles peuvent déclencher considérablement un accrochage sur un autre cadre pour lancer un processus commercial particulier.

Qui a besoin d’un pipeline d’informations ?

Si un pipeline d’informations n’est pas nécessaire pour chaque entreprise, cette innovation est particulièrement utile pour celles qui en ont besoin :

Créer, dépendre ou stocker des sommes énormes ou de nombreuses sources d’information

Maintenir des sources d’information cloisonnées

Exiger un examen constant ou exceptionnellement raffiné des informations

Stocker les informations dans le nuage

Comme vous pouvez le constater, la grande majorité des organisations avec lesquelles vous êtes en contact de façon régulière – et probablement la vôtre – bénéficieraient d’un pipeline d’informations.

Types d’accords sur les filières d’information

Il existe divers arrangements de filières d’information accessibles, et chacun d’entre eux est approprié à diverses fins. Par exemple, vous devriez utiliser des dispositifs locaux dans le nuage au cas où vous essayeriez de transférer vos informations dans le nuage.

Le récapitulatif qui l’accompagne montre les types de pipelines les plus connus qui sont accessibles. Notez que ces cadres ne sont pas fondamentalement sans rapport. Vous pouvez avoir un pipeline d’informations qui est avancé à la fois pour le nuage et pour le continu, par exemple.

Un tas. La préparation des groupes est généralement utile lorsque vous avez besoin de déplacer d’énormes volumes d’informations à une période intermédiaire normale, et que vous ne devez pas déplacer les informations de manière continue. Par exemple, elle peut être utile pour intégrer vos informations publicitaires dans un cadre d’examen plus large.

Constant. Ces appareils sont mis à niveau pour traiter l’information en continu. La continuité est utile lorsque vous traitez des informations provenant d’une source de déversement, par exemple, les informations des marchés monétaires ou la télémétrie des gadgets associés.

Nuage local. Ces appareils sont mis à niveau pour fonctionner avec des informations basées sur le nuage, par exemple, des informations provenant de seaux AWS. Ces dispositifs sont facilités dans le nuage, ce qui vous permet d’obtenir une bonne affaire sur le cadre et les actifs maîtres puisque vous pouvez compter sur la fondation et la maîtrise du commerçant qui facilite votre pipeline.

Open-source. Ces instruments sont d’autant plus précieux que vous avez besoin d’un minimum d’efforts, contrairement à un vendeur d’entreprise, et que vous avez l’aptitude à créer ou à élargir l’appareil pour vos motivations. Les instruments à source ouverte sont souvent moins chers que leurs partenaires commerciaux, mais il faut en maîtriser l’utilité compte tenu du fait que l’innovation fondamentale est librement accessible et qu’elle est destinée à être modifiée ou à être diffusée par les clients.

Le premier stade

D’accord, vous êtes donc persuadé que votre organisation a besoin d’un pipeline d’informations. Par où commencer ?

Vous pourriez faire appel à un groupe pour construire et entretenir votre propre pipeline d’informations en interne. C’est ce que cela implique :

Mise en place d’une approche de filtrage des informations d’approche (qu’elles soient basées sur des documents, jaillissantes ou autres)

Interfacer et modifier les informations provenant de chaque source pour coordonner l’organisation et le plan de son objectif

Déplacement de l’information vers la base de données/la réserve d’informations objectives

Inclure et effacer des champs et modifier le schéma en fonction de l’évolution des conditions d’organisation

Se faire un devoir continu et perpétuel de tenir à jour et d’améliorer la chaîne d’information

Cela dépend du caractère exorbitant de la procédure, tant en termes de biens que de temps. Vous aurez besoin d’une main-d’œuvre expérimentée (et donc coûteuse), soit sous contrat, soit préparée et détachée d’autres activités et projets de grande valeur. La fabrication pourrait prendre beaucoup de temps, ce qui entraînerait des coûts critiques pour la porte ouverte. Enfin, il peut très bien être difficilement proportionnel à ce genre d’arrangements puisque vous devez inclure l’équipement et les personnes, ce qui peut être hors du plan de dépenses.

Un arrangement moins complexe et plus pratique consiste à mettre des ressources dans un solide pipeline d’informations, par exemple, Alooma. En voici la raison :

Vous bénéficiez rapidement d’une estime hors du conteneur, ce qui vous épargne le temps nécessaire à l’élaboration d’un accord interne

Vous n’avez pas besoin de retirer des actifs d’entreprises ou d’articles existants pour assembler ou entretenir votre pipeline d’informations

Dans le cas où des problèmes surgissent, vous pouvez faire confiance à quelqu’un pour les résoudre, au lieu de retirer des actifs de différentes activités ou de négliger de respecter un accord de niveau de service.

Il vous offre une chance de vous laver et d’améliorer vos informations à la volée

Il permet un examen continu et sécurisé des informations, même provenant de différentes sources en même temps, en plaçant les informations dans un centre de distribution d’informations dans le nuage

Vous pouvez imaginer l’information en mouvement

Vous bénéficiez d’une grande sérénité grâce à une sécurité de niveau “big business” et à un dispositif 100% conforme aux normes SOC 2 Sort II, HIPAA et GDPR

Les changements de plan et les nouvelles sources d’information sont effectivement consolidés

Travailler dans l’erreur implique que l’information ne sera pas perdue si l’empilement est insuffisant

Langages

Weekly newsletter

No spam. Just the latest releases and tips, interesting articles, and exclusive interviews in your inbox every week.