O perspectivă asupra a 26 de tehnici de analiză a datelor mari: partea 1
O perspectivă asupra a 26 de tehnici de analiză a datelor mari: partea 1
În ultimul meu blog , am vorbit despre Instrumentele de extracție a datelor cu sursă deschisă. Obiectivul principal al unui „instrument ETL” este de a aduna conținutul diferitelor baze de date sau sisteme operaționale din organizația dumneavoastră și de a muta/copia/transfera toate aceste date într-o bază de date centralizată. Această „bază de date centralizată” este adesea numită „depozit de date”. Alternativ, instrumentele ETL sunt, de asemenea, folosite pentru a efectua transformări complexe de date care sunt dificil de realizat folosind instrucțiuni SQL simple.
Iată lista unor instrumente ETL comerciale:
Este un instrument ETL și face parte din suita IBM Information Platforms Solutions și IBM InfoSphere. Utilizează o notație grafică pentru a construi soluții de integrare a datelor. Integrează datele în mai multe sisteme folosind un cadru paralel de înaltă performanță și acceptă gestionarea extinsă a metadatelor și conectivitate întreprindere. Platforma scalabilă oferă o integrare mai flexibilă a tuturor tipurilor de date, inclusiv date mari în repaus (pe baza Hadoop) sau în mișcare (pe baza de flux), pe platforme distribuite și mainframe.
Servicii de integrare Microsoft SQL Server (SSIS) –
Microsoft SSIS este un instrument de integrare, transformare și migrare a datelor pentru întreprinderi, care este încorporat în baza de date SQL Server a Microsoft. Poate fi folosit pentru o varietate de sarcini legate de integrare, cum ar fi analiza și curățarea datelor și rularea proceselor de extragere, transformare și încărcare pentru a actualiza depozitele de date.
Vezi și: O perspectivă asupra a 26 de tehnici de analiză a datelor mari
Adeptia oferă funcționalitate ETL completă combinată cu o interfață simplă și intuitivă; oferind utilizatorilor posibilitatea de a transforma un număr de fișiere diferite. Adeptia ETL Suite este concepută chiar și pentru persoane care nu fac parte din IT, oferind utilizatorilor de afaceri puterea de a-și accesa datele în timp real și de a-și transforma propriile date pentru a se potrivi cu operațiunile lor, permițând în același timp IT să gestioneze procesele și să se asigure că datele sunt gestionate în siguranță și corect.
Informatica Powercenter –
Informatica Power Center este un instrument de extracție, transformare și încărcare utilizat pe scară largă, utilizat în construirea depozitelor de date ale întreprinderii. Principalele componente ale Informatica PowerCenter sunt instrumentele sale client, serverul, serverul de depozit și depozitul. Serverul Power Center și serverul de depozit alcătuiesc stratul ETL, care completează procesarea ETL.
Data Migrator este un instrument automat puternic și cuprinzător, conceput pentru a simplifica în mod dramatic procesele de extragere, transformare și încărcare (ETL), inclusiv crearea, întreținerea și extinderea depozitelor de date, a magazinelor de date și a depozitelor de date operaționale. O interfață intuitivă permite crearea rapidă a proceselor ETL end-to-end care implică structuri de date eterogene pe platforme de calcul disparate. În plus, o funcție de captare a datelor de modificare încarcă doar înregistrările modificate în sursa dvs. de date, reducând dramatic timpul necesar pentru reîmprospătarea datelor și facilitând un depozit de date aproape în timp real.
Vezi și: Zona gri Big Data – Ce se poate și ce nu
Elixir Data ETL –
Elixir Data ETL este conceput pentru a oferi manipulare a datelor la cerere, cu autoservire, pentru utilizatorii de afaceri, precum și pentru nevoile de prelucrare a datelor la nivel de întreprindere. Paradigma sa de modelare vizuală reduce drastic timpul necesar pentru a proiecta, testa și implementa extragerea, agregarea și transformarea datelor - un proces critic pentru orice procesare a aplicațiilor, raportare întreprindere și măsurare a performanței, inițiative de data mart sau depozitare de date.
Syncsort DMX aduce toate transformările datelor într-un motor ETL în memorie de performanță mai ridicată. Transformările sunt procesate din mers, eliminând necesitatea unor zone costisitoare de depozitare a bazei de date sau împingând manual transformările în baza de date.
Managementul datelor SAS –
SAS Data Management permite utilizatorilor dvs. de afaceri să actualizeze datele, să modifice procesele și să analizeze ei înșiși rezultatele, eliberându-se pentru alte proiecte. În plus, un glosar de afaceri încorporat, precum și capabilitățile de gestionare a metadatelor și de vizualizare a filiației SAS și terță parte îi mențin pe toți pe aceeași pagină.
Servicii de date SAP –
Ajută la integrarea, transformarea și îmbunătățirea datelor la nivel de proiect sau de întreprindere. Oferă o singură soluție de clasă enterprise pentru integrarea datelor, calitatea datelor, profilarea datelor și procesarea datelor text, care permite utilizatorilor să integreze, să transforme, să îmbunătățească și să furnizeze date.
ORACLE DATA INTEGRATOR ENTERPRISE EDITION –
Oferă tehnologia Extract Load and Transform (E-LT) care îmbunătățește performanța și reduce costurile de integrare a datelor – chiar și în sistemele eterogene. Oferă de înaltă performanță și TCO mai mic, suport pentru platforme eterogene pentru integrarea datelor întreprinderii și module de cunoștințe pentru productivitate și extensibilitate optimizate pentru dezvoltatori.
Meta Suite –
Meta Suite vă oferă un time-to-value rapid, scalabilitate și o gamă bogată de tipuri de fișiere sursă și țintă și baze de date acceptate. În afară de operațiunea normală de extragere, încărcare și îmbinare a datelor operaționale, poate fi folosit și pentru a consolida și raționaliza datele și pentru a oferi ca atare suport pentru Master Data Management.
Citiți și: Un ghid pentru începători pentru Big Data Analytics
Acum face parte din Actian. Efectuează operațiuni complexe de integrare, deși software-ul este remarcabil de ușor de utilizat și nu necesită un set de abilități specializate. Caracteristicile sale bogate sunt extrem de intuitive și configurabile pentru proiectare, implementare și gestionare – fără șocul autocolantului. Are aceeași interfață de utilizare web cu funcții complete, folosită atât pentru versiunile on-premise, cât și pentru cele cloud.
Flux de date Sagent –
Este un motor de integrare puternic și flexibil care adună date din surse disparate. Este proiectat de Pitney Bowes Software și oferă un set cuprinzător de instrumente de transformare a datelor pentru a-și îmbunătăți valorile de afaceri. Permite analizarea informațiilor și crearea de rapoarte semnificative pentru a ajuta la înțelegerea afacerii dvs
Citește și: Top 15 instrumente Big Data în 2017
Alegerea oricărui software sau instrument este decisă de ce tip de cerință are și care variază de la o afacere la alta. O afacere de telecomunicații ar avea date mari și complexe de gestionat în comparație cu magazinul de haine. Deci, o afacere de telecomunicații ar alege un instrument care are caracteristici pentru a opera pe date complexe. Întrucât, un magazin cu amănuntul ar alege un instrument ușor de utilizat, cu mai puține complexități, deoarece nu are abilitățile de programare și cunoștințele tehnice.
În următorul meu blog, aș enumera instrumente pentru următorul strat din Arhitectura de referință.
O perspectivă asupra a 26 de tehnici de analiză a datelor mari: partea 1
Mulți dintre voi cunoașteți Switch care va fi lansat în martie 2017 și noile sale funcții. Pentru cei care nu știu, am pregătit o listă de funcții care fac din „Switch” un „gadget obligatoriu”.
Aștepți ca giganții tehnologiei să-și îndeplinească promisiunile? vezi ce a ramas nelivrat.
Citiți blogul pentru a cunoaște diferitele straturi din Arhitectura Big Data și funcționalitățile acestora în cel mai simplu mod.
Citiți asta pentru a afla cum devine populară inteligența artificială în rândul companiilor la scară mică și cum crește probabilitățile de a le face să crească și de a le oferi concurenților avantaje.
CAPTCHA a devenit destul de dificil de rezolvat pentru utilizatori în ultimii ani. Va fi capabil să rămână eficient în detectarea spam-ului și a botului în viitor?
Pe măsură ce Știința Evoluează într-un ritm rapid, preluând multe dintre eforturile noastre, crește și riscurile de a ne supune unei Singularități inexplicabile. Citiți, ce ar putea însemna singularitatea pentru noi.
Ce este telemedicina, îngrijirea medicală la distanță și impactul acesteia asupra generației viitoare? Este un loc bun sau nu în situația de pandemie? Citiți blogul pentru a găsi o vedere!
Poate ați auzit că hackerii câștigă mulți bani, dar v-ați întrebat vreodată cum câștigă acești bani? sa discutam.
Recent, Apple a lansat macOS Catalina 10.15.4 o actualizare suplimentară pentru a remedia problemele, dar se pare că actualizarea provoacă mai multe probleme care duc la blocarea mașinilor Mac. Citiți acest articol pentru a afla mai multe