หน้าก่อนหน้า

บทที่ 8 ระบบจัดการฐานข้อมูล

เรื่องต่อไป

8.7 ความหมายและความแตกต่างของ ฐานข้อมูล (Database) คลังข้อมูล (Data Warehouse) เหมืองข้อมูล (Data Mining) และ คลังข้อมูลขนาดเล็ก(Data Mart)

1.ความหมาย

Database (ฐานข้อมูล) เป็นกลุ่มของข้อมูล ที่มีการจัดการเพื่อทำให้ เข้าถึง จัดการและปรับปรุงได้ง่าย ประเภทของฐานข้อมูล ที่เด่นมาก คือฐานข้อมูลสัมพันธ์ (Relational Database) ซึ่งฐานข้อมูลเก็บข้อมูลในแบบของตาราง ทำให้สามารถจัดการและเข้าถึงได้หลายวิธี ฐานข้อมูลกระจาย (Distributed Database) เป็นฐานข้อมูลที่สามารถกระจายและทำซ้ำ (Replicate) ระหว่างจุดต่าง ๆ บนเครือข่าย Object-oriented Programming Database หมายถึงข้อมูลที่กำหนดในออบเจคคลาส (Class) และคลาสย่อย (Subclass)

Data Warehouse หมายถึง ฐานข้อมูลขนาดใหญ่ขององค์กรหรือหน่วยงานหนึ่งๆ ซึ่งเก็บ รวบรวมข้อมูลจากฐานข้อมูล ระบบงานประจำวัน เรียกอีกอย่างว่า operational database หรืออาจเรียกว่า Internal Data Sources และฐานข้อมูลอื่นภายนอกองค์กร หรือเรียกว่า external database โดยข้อมูลที่ถูกจัดเก็บในคลังข้อมูลนั้น มีวัตถุประสงค์ในการนำมาใช้งาน และมีลักษณะของการ จัดเก็บแตกต่างไปจากข้อมูลในฐานข้อมูลระบบงานอื่น การย้ายข้อมูลจากฐานข้อมูลปกติ เข้าไปไว้ ใน Date Warehouse มีข้อดีหลายอย่าง เช่น ทำให้องค์กรหรือ เจ้าของข้อมูล มีโอกาสได้ออกแบบ รูปแบบการเก็บข้อมูลใหม่ให้เหมาะสมกับการเรียกใช้มากยิ่งขึ้น และทำให้เหมาะ สำหรับการนำไปใช้ ช่วยในการตัดสินใจ หรือใช้ในงานวิเคราะห์ นอกจากนั้นระบบ Data Warehouse ยังรวมเอา ข้อมูลที่ ใช้อยู่ในปัจจุบันเข้ากับข้อมูลในอดีตเข้าเป็นฐานข้อมูลเดียวกัน สามารถเรียกใช้งานได้จาก อินเตอร์เฟสแบบ กราฟิกได้โดยตรง (GUI) พร้อมสำหรับการจัดการข้อมูลและนำข้อมูลที่ได้ไป วิเคราะห์ ข้อดีสุดท้ายก็คือ ระบบ Data Warehouse ทำให้ผู้ใช้ระดับสูง หรือพนักงานทั่วไปสามารถ เข้าถึงและเรียกใช้ฐานข้อมูลได้ด้วยตัวเอง โดยไม่ต้องอาศัยความช่วยเหลือจากเจ้าหน้าที่ทาง IT อีก ต่อไป ทำให้ทั้งคู่คือพนักงานและเจ้าหน้าที่ไอทีทำงานได้สะดวกและมีประสิทธิภาพ มากขึ้น

Data Mining คือ ชุดซอฟต์แวร์วิเคราะห์ข้อมูลที่ได้ถูกออกแบบมาเพื่อระบบสนับสนุนการตัดสินใจของผู้ใช้ มันเป็นซอฟต์แวร์ที่สมบรูณ์ทั้งเรื่องการค้นหา การทำรายงาน และโปรแกรมในการจัดการ ซึ่งเราคุ้นเคยดีกับคำว่า Executive Information System ( EIS ) หรือระบบข้อมูลสำหรับการตัดสินใจในการบริหาร ซึ่งเป็นเครื่องมือชิ้นใหม่ที่สามารถค้นหาข้อมูลในฐานข้อมูลขนาดใหญ่หรือข้อมูลที่เป็นประโยชน์ในการบริหาร ซึ่งเป็นการเพิ่มคุณค่าให้กับฐานข้อมูลที่มีอยู่ ระบบสนับสนุนการตัดสินใจ (Decision Support System) คือทำอย่างไรให้ข้อมูลที่เรามีอยู่กลายเป็นความรู้อันมีค่าได้สร้างคำตอบของอนาคตได้ นี่คือจุดประสงค์ของ Data Mining ที่จะมาช่วยในเรื่องของเทคนิคการจัดการข้อมูล ซึ่งได้พยายามและทดสอบแล้วและข้อมูลสนับสนุนที่มีอาจย้อนหลังไปถึง 30 ปี ด้วยเทคนิคเดียวกันนี้เราสามารถใช้ค้นข้อมูลสำคัญที่ปะปนกับข้อมูลอื่น ๆ ในฐานข้อมูลที่ไม่ใช่แค่การสุ่มหา บางคนเรียกว่า KDD ( Knowledge Discovery in Database ) หรือ การค้นหาข้อมูลด้วยความรู้ และนั่นก็คือ Data Mining

Data Mart เป็นที่รวมของข้อมูลที่รวมจากข้อมูลปฏิบัติงานและแหล่งข้อมูลอื่น ๆ ที่ได้รับการออกแบบให้รองรับการใช้งานเฉพาะของผู้ใช้ที่มีระดับความรู้ ในแนวคิด ข้อมูลจะมีที่มีจากฐานข้อมูลของธุรกิจ หรือ data warehouse หรือเฉพาะเจาะจง สิ่งที่เกิดขึ้น data mart ได้รับการใช้โดยความต้องการของกลุ่มผู้ใช้เฉพาะที่มีความรู้ในการวิเคราะห์ เก็บรายละเอียด นำเสนอ และใช้งานได้ง่าย ซึ่งผู้ใช้ data mart สามารถคาดหวังว่าข้อมูลที่จะนำเสนอจะอยู่ในรูปที่คุ้นเคย

2.ความแตกต่าง

Database เป็นที่เก็บรวบของเรคคอร์ดข้อมูล หรือไฟล์ เช่น รายการการขาย รายการผลิตภัณฑ์ คลังสินค้า หรือรายละเอียดของลูกค้า โดยปกติผู้จัดการฐานข้อมูลให้ผู้ใช้ สามารถควบคุมการอ่าน เขียน เข้าถึง ระบุการ การสร้างรายงาน และวิเคราะห์การใช้ ฐานข้อมูล และผู้จัดการฐานข้อมูล มีบทบาทเด่นในระบบเมนเฟรม ระบบเวิร์กสเตชัน ระบบขนาดกลาง เช่น AS 400 และคอมพิวเตอร์ส่วนบุคคล ภาษา Structured Query Language เป็นภาษามาตรฐาน สำหรับการสร้าง คิวรี่ ในปรับปรุงฐานข้อมูล เช่น IBM's DB2, Microsoft Access , Sybase และ Computer Associates

Data Warehouse สาเหตุที่ต้องใช้ เพราะ องค์กรต่างๆ ในปัจจุบันส่วนใหญ่จะมีการลงทุนลงแรงไปมาก กับระบบที่เรียกว่า “ระบบ ฐานข้อมูลประจำวัน Operational System” ระบบสารนิเทศที่ว่านี้จะมีหน้าที่หลักในการรวบรวมและ จัดเก็บข้อมูลเอาไว้ ไม่ว่าจะเป็นข้อมูล ของลูกค้า ข้อมูลการขาย ข้อมูลฝ่ายบุคคลหรือข้อมูลเกี่ยวกับ คงคลังก็ตาม เนื่องจากระบบเหล่านี้มีการลงทุนไปมาก ดังนั้นปริมาณข้อมูลที่มหาศาลก็เลยถือได้ว่าเป็น ทรัพย์สินและ ทรัพยากรอย่างหนึ่งขององค์กรด้วย และจำเป็นต้องมีการจัดการที่เหมาะสมเพื่อนำเอาทรัพย์สินเหล่านี้มาใช้อย่างเกิด ประโยชน์สูงสุด หลาย ๆ องค์กรนำข้อมูลเหล่านี้มาช่วยในการ ตัดสินใจโดยประยุกต์ใช้เป็นระบบ “Decision Support System” (DSS) โดยนำเอาระบบ Data Warehouse มาช่วยเพื่อให้ผู้บริหารสามารถเรียกใช้ข้อมูลที่ต้องการได้อย่างรวดเร็วและมีประสิทธิภาพ มากขึ้นข้อมูลเชิงบริหารนี้จะสามารถช่วยลดปัญหาที่เกิดจากการใช้ข้อมูลจากฐานข้อมูลปฏิบัติการ(Operational Database) ซึ่งเป็นการเก็บข้อมูลในรูปแบบ Transaction System ได้ ซึ่งโดยทั่วไปปัญหา ที่พบเมื่อต้องการข้อมูลที่ช่วยในการตัดสินใจได้แก่

1. การเรียกข้อมูลจากฐานข้อมูลปฏิบัติการ ซึ่งมีขนาดใหญ่ ทำให้ประสิทธิภาพของระบบลดลง และทำงานได้ช้าลง

2. ข้อมูลที่นำเสนอมีรูปแบบเดียว ไม่สามารถเปลี่ยนแปลงได้ตามความต้องการของผู้บริหาร

3. ไม่สามารถหาคำตอบในเชิงพยากรณ์ได้

4. ไม่ตอบสนองการทำคิวรีที่ซับซ้อนได้ดีเท่าที่ควร

5. ข้อมูลถูกจัดเก็บอยู่ ตามฐานข้อมูลของระบบงานต่างๆ ซึ่งยากแก่การเรียกใช้และขาดความสัมพันธ์ทางธุรกิจ

6. จากรูปจะเห็นได้ว่าการดึงข้อมูลจาก Database และ Data Warehouse ก็สามารถเชื่อมต่อ กับ Internet ได้ Data Mining สาเหตุที่ต้องใช้ เพราะ

6.1 จำนวนและขนาดข้อมูลขนาดใหญ่ถูกผลิตและขยายตัวอย่างรวดเร็ว การสืบค้นความรู้จะมีความหมายก็ต่อเมื่อฐานข้อมูลที่ใช้มีขนาดใหญ่มาก ปัจจุบันมีจำนวนและขนาดข้อมูลขนาดใหญ่ที่ขยายตัวอย่างรวดเร็ว โดยผ่านทาง Internet ดาวเทียม และแหล่งผลิตข้อมูล อื่น ๆ เช่น เครื่องอ่านบาร์โค้ด เครดิตการ์ด อีคอมเมิร์ซ

6.2 ข้อมูลถูกจัดเก็บเพื่อนำไปสร้างระบบการสนับสนุนการตัดสินใจ (Decision Support System) เพื่อเป็นการง่ายต่อการนำข้อมูลมาใช้ในการวิเคราะห์เพื่อการตัดสินใจ ส่วนมากข้อมูลจะถูกจัดเก็บแยกมาจากระบบปฏิบัติการ (Operational System) โดยจัดอยู่ในรูปของคลังหรือเหมืองข้อมูล ( Data Warehouse ) ซึ่งเป็นการง่ายต่อการนำเอาไปใช้ในการสืบค้นความรู้

6.3 ระบบ Computer สมรรถนะสูงมีราคาต่ำลง เทคนิค Data Mining ประกอบไปด้วย Algorithm ที่มีความซับซ้อนและความต้องการการคำนวณสูง จึงจำเป็นต้องใช้งานกับระบบ Computer สมรรถนะสูง ปัจจุบันระบบ Computer สมรรถนะสูงมีราคาต่ำลง พร้อมด้วยเริ่มมีเทคโนโลยีที่นำเครื่อง Micro Computer จำนวนมากมาเชื่อมต่อกันโดยเครือข่ายความเร็วสูง (PC Cluster) ทำให้ได้ระบบ Computer สมรรถนะสูงในราคาต่ำ

6.4 การแข่งขันอย่างสูงในด้านอุตสาหกรรมและการค้า เนื่องจากปัจจุบันมีการแข่งขันอย่างสูงในด้านอุตสาหกรรมและการค้า มีการผลิตข้อมูลไว้อย่างมากมายแต่ไม่ได้นำมาใช้ให้เกิดประโยชน์ จึงเป็นการจำเป็นอย่างยิ่งที่ต้องควบคุมและสืบค้นความรู้ที่ถูกซ่อนอยู่ในฐานข้อมูลความรู้ที่ได้รับสามารถนำไปวิเคราะห์เพื่อการตัดสินใจในการจัดการในระบบต่าง ๆ ซึ่งจะเห็นได้ว่าความรู้เหล่านี้ถือว่าเป็นผลิตผลอีกชิ้นหนึ่ง

Data Mart เป็นการแสดงนัยยะของข้อมูลในบางรูปแบบ อย่างไรก็ตาม ผู้เขียนส่วนมากใช้คำที่ดูเหมือนการออกแบบ Data Mart มีแนวโน้มที่จะเริ่มจากการวิเคราะห์ตามความต้องการของผู้ใช้ และ Data Warehouse เริ่มจากการวิเคราะห์ข้อมูลที่มีอยู่จริง และการรวบรวมข้อมูลในทางที่ข้อมูลสามารถทำไปใช้ต่อ Data Warehouse เป็นการรวมข้อมูลที่ส่วนกลาง ( ซึ่งสามารถกระจายทางกายภาค) Data Mart เป็นที่ข้อมูลรวมที่ได้จาก Data Warehouse และทำให้ง่ายในการเข้าถึง และการประยุกต์ สำหรับการออกแบบตามวัตถุประสงค์เฉพาะ โดยทั่วไป Data Warehouse มีแนวโน้มในการการใช้เชิงกลยุทธศาสตร์ แต่แนวคิดยังไม่ชัดเจน Data Mart มีแนวโน้มการเชิงยุทธวิธี และจุดมุ่งหมายสำหรับการนำไปใช้ทันที



Home