En mi último blog , hablamos sobre las herramientas de extracción de datos de código abierto. El objetivo principal de una "herramienta ETL" es recopilar el contenido de varias bases de datos o sistemas operativos en su organización y mover / copiar / transferir todos estos datos a una base de datos centralizada. Esta "base de datos centralizada" a menudo se denomina "almacén de datos". Alternativamente, las herramientas ETL también se utilizan para realizar transformaciones de datos complejas que son difíciles de realizar utilizando sentencias SQL simples.
Aquí está la lista de algunas herramientas ETL comerciales:
Es una herramienta ETL y parte de la suite IBM Information Platforms Solutions e IBM InfoSphere. Utiliza una notación gráfica para construir soluciones de integración de datos. Integra datos en múltiples sistemas utilizando un marco paralelo de alto rendimiento y es compatible con la administración de metadatos extendida y la conectividad empresarial. La plataforma escalable proporciona una integración más flexible de todo tipo de datos, incluidos big data en reposo (basado en Hadoop) o en movimiento (basado en flujo), en plataformas distribuidas y mainframe.
Microsoft SSIS es una herramienta de integración de datos empresariales, transformación de datos y migración de datos que está integrada en la base de datos SQL Server de Microsoft. Se puede utilizar para una variedad de tareas relacionadas con la integración, como analizar y limpiar datos y ejecutar procesos de extracción, transformación y carga para actualizar los almacenes de datos.
Ver también: Una visión de 26 técnicas analíticas de Big Data
Adeptia ofrece una funcionalidad ETL completa combinada con una interfaz fácil e intuitiva; dando a los usuarios la capacidad de transformar varios archivos diferentes. Adeptia ETL Suite está diseñada incluso para personas que no son de TI, brindando a los usuarios comerciales la capacidad de acceder a sus datos en tiempo real y transformar sus propios datos para que se ajusten a sus operaciones, al tiempo que permite a TI administrar los procesos y garantizar que los datos se administren de manera segura y correctamente.
Informatica Power Center es una herramienta de extracción, transformación y carga ampliamente utilizada en la creación de almacenes de datos empresariales. Los componentes principales de Informatica PowerCenter son sus herramientas cliente, servidor, servidor de repositorio y repositorio. El servidor de Power Center y el servidor de repositorio forman la capa ETL, que completa el procesamiento ETL.
Data Migrator es una herramienta automatizada potente y completa diseñada para simplificar drásticamente los procesos de extracción, transformación y carga (ETL), incluida la creación, el mantenimiento y la expansión de almacenes de datos, mercados de datos y almacenes de datos operativos. Una interfaz intuitiva permite la creación rápida de procesos ETL de extremo a extremo que involucran estructuras de datos heterogéneas en plataformas informáticas dispares. Además, una función de captura de datos modificados carga solo los registros modificados en su fuente de datos, lo que reduce drásticamente el tiempo necesario para actualizar los datos y facilita un almacén de datos casi en tiempo real.
Consulte también: El área gris de Big Data: lo que se debe y no se debe hacer
Elixir Data ETL está diseñado para proporcionar manipulación de datos de autoservicio bajo demanda para usuarios comerciales, así como para las necesidades de procesamiento de datos a nivel empresarial. Su paradigma de modelado visual reduce drásticamente el tiempo necesario para diseñar, probar e implementar la extracción, agregación y transformación de datos, un proceso crítico para cualquier procesamiento de aplicaciones, informes empresariales y medición del rendimiento, mercado de datos o iniciativas de almacenamiento de datos.
Syncsort DMX lleva todas las transformaciones de datos a un motor ETL en memoria de mayor rendimiento. Las transformaciones se procesan sobre la marcha, lo que elimina la necesidad de costosas áreas de preparación de bases de datos o la inserción manual de transformaciones en la base de datos.
SAS Data Management permite que los usuarios de su negocio actualicen datos, modifiquen procesos y analicen los resultados ellos mismos, dejándolos libres para otros proyectos. Además, un glosario empresarial integrado, así como las capacidades de visualización de linaje y gestión de metadatos de SAS y de terceros, mantienen a todos en la misma página.
Ayuda a integrar, transformar y mejorar los datos a nivel de proyecto o empresa. Ofrece una única solución de clase empresarial para la integración de datos, la calidad de los datos, la elaboración de perfiles de datos y el procesamiento de datos de texto que permite a los usuarios integrar, transformar, mejorar y entregar datos.
Ofrece tecnología Extract Load and Transform (E-LT) que mejora el rendimiento y reduce los costos de integración de datos, incluso en sistemas heterogéneos. Proporciona alto rendimiento y menor costo total de propiedad, soporte de plataforma heterogénea para la integración de datos empresariales y módulos de conocimiento para optimizar la productividad y la extensibilidad del desarrollador.
Meta Suite le ofrece una rápida rentabilidad, escalabilidad y una amplia variedad de tipos de base de datos y archivos de origen y destino compatibles. Además de la operación normal de extracción, carga y fusión de datos operativos, también se puede utilizar para consolidar y racionalizar datos y brindar soporte para la gestión de datos maestros.
Lea también: Una guía para principiantes sobre análisis de macrodatos
Ahora es parte de Actian. Realiza operaciones de integración complejas, aunque el software es muy fácil de usar y no requiere un conjunto de habilidades especializadas. Sus numerosas funciones son altamente intuitivas y configurables para el diseño, la implementación y la administración, sin el impacto de la etiqueta. Tiene la misma interfaz de usuario web con todas las funciones que se usa tanto para las versiones en las instalaciones como en la nube.
Es un motor de integración potente y flexible que recopila datos de fuentes dispares. Está diseñado por Pitney Bowes Software y proporciona un conjunto completo de herramientas de transformación de datos para mejorar sus valores comerciales. Permite analizar información y crear informes significativos para ayudar a comprender su negocio.
Lea también: Las 15 mejores herramientas de Big Data en 2017
La elección de cualquier software o herramienta se decide por el tipo de requisito que se tiene y que varía de una empresa a otra. Una empresa de telecomunicaciones tendría que manejar datos grandes y complejos en comparación con una tienda minorista de ropa. Por lo tanto, una empresa de telecomunicaciones seleccionaría una herramienta que tenga características para operar con datos complejos. Considerando que, una tienda minorista optaría por una herramienta fácil de usar con menos complejidades, ya que no tiene las habilidades de programación ni los conocimientos técnicos.
En mi próximo blog, enumeraría las herramientas para la siguiente capa en la Arquitectura de referencia.