ในบล็อกที่แล้ว เราได้พูดถึงเครื่องมือดึงข้อมูลโอเพ่นซอร์ส วัตถุประสงค์หลักของ "เครื่องมือ ETL" คือการรวบรวมเนื้อหาของฐานข้อมูลต่างๆ หรือระบบปฏิบัติการทั่วทั้งองค์กรของคุณ และย้าย/คัดลอก/โอนข้อมูลทั้งหมดนี้ไปยังฐานข้อมูลแบบรวมศูนย์ "ฐานข้อมูลแบบรวมศูนย์" นี้มักถูกเรียกว่า "คลังข้อมูล" อีกทางหนึ่ง เครื่องมือ ETL ยังใช้เพื่อดำเนินการแปลงข้อมูลที่ซับซ้อนซึ่งยากต่อการสร้างโดยใช้คำสั่ง SQL อย่างง่าย
นี่คือรายการเครื่องมือ ETL เชิงพาณิชย์บางส่วน:
เป็นเครื่องมือ ETL และเป็นส่วนหนึ่งของชุดโซลูชันแพลตฟอร์มข้อมูลของ IBM และ IBM InfoSphere ใช้สัญกรณ์กราฟิกเพื่อสร้างโซลูชันการรวมข้อมูล รวมข้อมูลในหลายระบบโดยใช้เฟรมเวิร์กคู่ขนานที่มีประสิทธิภาพสูง และสนับสนุนการจัดการข้อมูลเมตาแบบขยายและการเชื่อมต่อระดับองค์กร แพลตฟอร์มที่ปรับขนาดได้มอบการผสานรวมข้อมูลทุกประเภทที่ยืดหยุ่นยิ่งขึ้น รวมถึงข้อมูลขนาดใหญ่ที่อยู่นิ่ง (แบบ Hadoop) หรือแบบเคลื่อนไหว (แบบสตรีม) บนแพลตฟอร์มแบบกระจายและเมนเฟรม
Microsoft SSIS คือเครื่องมือการรวมข้อมูลระดับองค์กร การแปลงข้อมูล และการย้ายข้อมูลที่สร้างขึ้นในฐานข้อมูล SQL Server ของ Microsoft สามารถใช้สำหรับงานที่เกี่ยวข้องกับการรวมต่างๆ เช่น การวิเคราะห์และล้างข้อมูล และเรียกใช้การแตกไฟล์ แปลงร่าง และโหลดกระบวนการเพื่ออัปเดตคลังข้อมูล
ดูเพิ่มเติมที่: ข้อมูลเชิงลึกเกี่ยวกับ 26 เทคนิคการวิเคราะห์ข้อมูลขนาดใหญ่
Adeptia นำเสนอฟังก์ชัน ETL เต็มรูปแบบพร้อมกับอินเทอร์เฟซที่ใช้งานง่าย ทำให้ผู้ใช้สามารถแปลงไฟล์ต่างๆ ได้หลายไฟล์ Adeptia ETL Suite ได้รับการออกแบบมาสำหรับบุคคลที่ไม่ใช่ฝ่ายไอที โดยให้ผู้ใช้ในธุรกิจสามารถเข้าถึงข้อมูลได้แบบเรียลไทม์และแปลงข้อมูลของตนเองให้เหมาะสมกับการดำเนินงาน ในขณะที่ยังคงให้ฝ่ายไอทีจัดการกระบวนการต่างๆ และทำให้มั่นใจได้ว่าข้อมูลจะได้รับการจัดการอย่างปลอดภัยและ อย่างถูกต้อง
Informatica Power Center เป็นเครื่องมือในการดึง แปลง และโหลดที่ใช้กันอย่างแพร่หลายในการสร้างคลังข้อมูลขององค์กร องค์ประกอบหลักของ Informatica PowerCenter คือเครื่องมือไคลเอนต์ เซิร์ฟเวอร์ เซิร์ฟเวอร์ที่เก็บ และที่เก็บ เซิร์ฟเวอร์ Power Center และเซิร์ฟเวอร์ที่เก็บประกอบขึ้นเป็น ETL Layer ซึ่งทำให้การประมวลผล ETL เสร็จสมบูรณ์
Data Migrator เป็นเครื่องมืออัตโนมัติที่ทรงพลังและครอบคลุม ซึ่งออกแบบมาเพื่อลดความซับซ้อนของกระบวนการดึงข้อมูล การแปลง และโหลด (ETL) อย่างมาก รวมถึงการสร้าง การบำรุงรักษา และการขยายคลังข้อมูล ดาต้ามาร์ท และที่เก็บข้อมูลในการดำเนินงาน อินเทอร์เฟซที่ใช้งานง่ายช่วยให้สามารถสร้างกระบวนการ ETL แบบ end-to-end ได้อย่างรวดเร็ว ซึ่งเกี่ยวข้องกับโครงสร้างข้อมูลที่ต่างกันในแพลตฟอร์มการคำนวณที่แตกต่างกัน นอกจากนี้ คุณลักษณะการเก็บข้อมูลการเปลี่ยนแปลงจะโหลดเฉพาะบันทึกที่เปลี่ยนแปลงลงในแหล่งข้อมูลของคุณ ซึ่งช่วยลดเวลาที่จำเป็นในการรีเฟรชข้อมูลได้อย่างมาก และอำนวยความสะดวกในคลังข้อมูลแบบเกือบเรียลไทม์
ดูเพิ่มเติม: The Big Data Grey Area – สิ่งที่ควรทำและไม่ควรทำ
Elixir Data ETL ได้รับการออกแบบมาเพื่อให้การจัดการข้อมูลแบบบริการตนเองตามความต้องการสำหรับผู้ใช้ทางธุรกิจตลอดจนความต้องการในการประมวลผลข้อมูลระดับองค์กร กระบวนทัศน์การสร้างแบบจำลองด้วยภาพช่วยลดเวลาที่ต้องใช้ในการออกแบบ ทดสอบ และใช้งานการดึงข้อมูล การรวมและการแปลงข้อมูล ซึ่งเป็นกระบวนการที่สำคัญสำหรับการประมวลผลแอปพลิเคชัน การรายงานขององค์กรและการวัดประสิทธิภาพ ดาต้ามาร์ท หรือแนวคิดริเริ่มด้านคลังข้อมูล
Syncsort DMX นำการแปลงข้อมูลทั้งหมดมาสู่เครื่องยนต์ ETL ในหน่วยความจำที่มีประสิทธิภาพสูงขึ้น การแปลงรูปแบบจะได้รับการประมวลผลทันที ขจัดความจำเป็นในการใช้พื้นที่การจัดเตรียมฐานข้อมูลที่มีค่าใช้จ่ายสูง หรือการผลักดันการแปลงไปยังฐานข้อมูลด้วยตนเอง
การจัดการข้อมูล SAS ช่วยให้ผู้ใช้ธุรกิจของคุณสามารถอัปเดตข้อมูล ปรับแต่งกระบวนการ และวิเคราะห์ผลลัพธ์ได้ด้วยตนเอง เพื่อเพิ่มพื้นที่ว่างสำหรับโครงการอื่นๆ นอกจากนี้ อภิธานศัพท์ทางธุรกิจในตัว เช่นเดียวกับ SAS และการจัดการข้อมูลเมตาของบริษัทอื่น และความสามารถในการแสดงภาพสายงานทำให้ทุกคนเข้าใจตรงกัน
ช่วยผสาน เปลี่ยนแปลง และปรับปรุงข้อมูลในระดับโครงการหรือระดับองค์กร นำเสนอโซลูชันระดับองค์กรเดียวสำหรับการรวมข้อมูล คุณภาพข้อมูล การทำโปรไฟล์ข้อมูล และการประมวลผลข้อมูลข้อความที่อนุญาตให้ผู้ใช้รวม แปลง ปรับปรุง และส่งมอบข้อมูล
นำเสนอเทคโนโลยี Extract Load and Transform (E-LT) ที่ปรับปรุงประสิทธิภาพและลดต้นทุนการรวมข้อมูล แม้กระทั่งในระบบที่ต่างกัน ให้ประสิทธิภาพสูงและ TCO ที่ต่ำกว่า การสนับสนุนแพลตฟอร์มที่แตกต่างกันสำหรับการรวมข้อมูลขององค์กรและโมดูลความรู้เพื่อเพิ่มประสิทธิภาพและความสามารถในการขยายของนักพัฒนา
Meta Suite ให้คุณสร้างมูลค่าได้รวดเร็ว ปรับขนาดได้ และมีตัวเลือกที่หลากหลายของไฟล์ต้นทางและเป้าหมายและประเภทฐานข้อมูลที่รองรับ นอกเหนือจากการทำงานปกติของการดึงข้อมูล โหลดและรวมข้อมูลการทำงาน ยังสามารถใช้เพื่อรวมและหาเหตุผลเข้าข้างตนเองของข้อมูลและส่งมอบตามการสนับสนุนดังกล่าวสำหรับการจัดการข้อมูลหลัก
อ่านเพิ่มเติม: คู่มือเริ่มต้นสำหรับการวิเคราะห์ข้อมูลขนาดใหญ่
ตอนนี้เป็นส่วนหนึ่งของ Actian แล้ว มันดำเนินการบูรณาการที่ซับซ้อน แม้ว่าซอฟต์แวร์จะใช้งานง่ายอย่างน่าทึ่งและไม่ต้องการชุดทักษะเฉพาะ ฟีเจอร์มากมายนั้นใช้งานง่ายและกำหนดค่าได้สูงสำหรับการออกแบบ การนำไปใช้งาน และการจัดการ โดยไม่ต้องตกใจกับสติกเกอร์ มีเว็บ UI ที่มีคุณสมบัติครบถ้วนเหมือนกับที่ใช้สำหรับทั้งเวอร์ชันภายในองค์กรและบนระบบคลาวด์
เป็นเครื่องมือการรวมที่มีประสิทธิภาพและยืดหยุ่นที่เปรียบเทียบข้อมูลจากแหล่งที่มาที่แตกต่างกัน ได้รับการออกแบบโดย Pitney Bowes Software และมีชุดเครื่องมือการแปลงข้อมูลที่ครอบคลุมเพื่อเพิ่มมูลค่าทางธุรกิจ ช่วยในการวิเคราะห์ข้อมูลและสร้างรายงานที่มีความหมายเพื่อช่วยให้เข้าใจธุรกิจของคุณ
ยังอ่าน: เครื่องมือข้อมูลขนาดใหญ่ 15 อันดับแรกในปี 2560
การเลือกซอฟต์แวร์หรือเครื่องมือใด ๆ จะขึ้นอยู่กับความต้องการประเภทใดและแตกต่างกันไปในแต่ละธุรกิจ ธุรกิจโทรคมนาคมจะมีข้อมูลขนาดใหญ่และซับซ้อนในการจัดการเมื่อเปรียบเทียบกับร้านค้าปลีกเสื้อผ้า ดังนั้น ธุรกิจโทรคมนาคมจะเลือกเครื่องมือที่มีคุณลักษณะเพื่อดำเนินการกับข้อมูลที่ซับซ้อน ในขณะที่ร้านค้าปลีกจะใช้เครื่องมือที่ใช้งานง่ายและมีความซับซ้อนน้อยกว่า เนื่องจากไม่มีทักษะในการเขียนโปรแกรมและภูมิหลังทางเทคนิค
ในบล็อกถัดไปของฉัน ฉันจะแสดงรายการเครื่องมือสำหรับเลเยอร์ถัดไปในสถาปัตยกรรมอ้างอิง