RAID คืออะไร?

RAID คืออะไร?

   RAID (Redundant Array of Inexpensive Disk) คือ การนำเอา Harddisk ตั้งแต่ 2 ตัวขึ้นไปมาทำงานร่วมกันเสมือนเป็น Harddisk ตัวเดียวที่มีประสิทธิภาพสูงขึ้น หรือมีโอกาสที่จะสูญเสียข้อมูลน้อยลงในกรณีที่เกิดความผิดพลาดของ Hardware (Fault Tolerance) กลุ่มของ Harddisk ที่เอามาทำงานร่วมกันในเทคโนโลยี RAID จะถูกเรียกว่า Disk Array โดยระบบปฏิบัติการ และ Software จะเห็น Harddisk ทั้งหมดเป็นตัวเดียว ซึ่งการทำ RAID นี้นอกจากจะเป็นการเพิ่มประสิทธิภาพของการเก็บรักษาข้อมูลแล้ว ยังเป็นการประหยัดอีกด้วย เพราะว่ายิ่ง Harddisk มีความจุมากเท่าไหร่ ราคาของมันก็จะยิ่งสูงขึ้นเท่านั้น ดังนั้น สำหรับงานที่จำเป็นต้องใช้พื้นที่ในการเก็บข้อมูลมากๆ อย่าง Database Server ถ้าเราเลือกใช้ Harddisk ความจุมากๆ เพียงตัวเดียว ในการเก็บข้อมูล หรือที่เรียกกันว่าเป็นการใช้ Harddisk แบบ SLED หรือ Single Large Expensive Disk ราคาที่เราเสียไปกับ Harddisk ตัวเดียวนั้น อาจจะไม่คุ้มค่าเท่ากับการใช้ Harddisk ที่มีความจุต่ำกว่า (ซึ่งแน่นอนว่าราคาต้องถูกกว่าหลายเท่าด้วย) นำมาต่อ เพื่อให้ทำงานร่วมกัน หรือที่เรียกกันว่าเป็นการใช้ Harddisk แบบ RAID นั้นเอง

   ก่อนที่เราจะไปรู้จัก RAID แบบต่างๆ เรามารู้จักคำว่า Data Striping กันก่อนครับ

   Data Striping คือ การแบ่งข้อมูลออกเป็นส่วนๆ แล้วนำแต่ละส่วนไปเก็บใน Harddisk แต่ละตัว การทำ Striping นี้จะช่วยให้การอ่าน หรือเขียนข้อมูลใน Disk Array มีประสิทธิภาพมากขึ้น เพราะแต่ละไฟล์จะถูกแบ่งเป็นส่วนๆ กระจายไปเก็บในส่วนที่ต่างกันของ Harddisk หลายตัว โดย Harddisk เหล่านั้นทำงานไปด้วยกันแบบขนาน (Parallel) จึงทำให้การเข้าถึงข้อมูลนั้นเร็วกว่า Harddisk แบบตัวเดียวอย่างแน่นอน

   และนี่คือ RAID แบบต่างๆ ที่มีความสามารถต่างกัน และถูกเอามาใช้ในงานที่แตกต่างกัน แล้วแต่ผู้ใช้ครับ


RAID 0



   คือ การเอา Harddisk มากกว่า 1 ตัวมาต่อร่วมกันในลักษณะ Non-Redundant ซึ่ง RAID 0 นี้มีจุดประสงค์ เพื่อที่จะเพิ่มความเร็วในการอ่าน/เขียนข้อมูล Harddisk โดยตรง ไม่มีการเก็บข้อมูลสำรอง ดังนั้นถ้าฮาร์ดดิสก์ตัวใดตัวหนึ่งเกิดเสียหาย ก็จะส่งผลให้ข้อมูลทั้งหมดไม่สามารถใช้งานได้ทันที จากรูป จะเห็นว่าข้อมูลจะถูกแบ่งไปเก็บที่ Harddisk ทั้ง 3 ตัว (กรณีที่เราใช้ Harddisk 3 ตัวมาต่อ RAID 0 กัน) และถ้าเพิ่มจำนวน Harddisk ใน Array ให้มากขึ้น เวลาที่ใช้อ่าน หรือเขียนข้อมูลก็จะลดลงไปตามสัดส่วนตามทฤษฎี แล้วถ้า Disk Array มี Harddisk จำนวน N ตัว ก็จะทำให้อ่าน หรือแขียนข้อมูลได้เร็วขึ้นเป็น N เท่าตัว แต่ด้วยเหตุผลและปัจจัยหลายประการ เช่น RAID Controller, ความคลาดเคลื่อนของความเร็ว Harddisk ทำให้ในความเป็นจริงอาจเร็วไม่ถึงตามทฤษฎี

จุดเด่นของ RAID 0 คือ ความเร็วในการเข้าถึงข้อมูล แต่ข้อเสียก็คือหาก Harddisk ตัวใดตัวหนึ่งเสียหาย จะส่งผลกับข้อมูลทั้งระบบทันที


RAID 1



   RAID 1 มีอีกชื่อหนึ่งว่า Disk Mirroring จะประกอบไปด้วย Harddisk 2 ตัวที่เก็บข้อมูลเหมือนกันทุกประการ เสมือนการสำรองข้อมูล หาก Harddisk ตัวใดตัวหนึ่งเกิดเสียหาย ระบบก็ยังสามารถดึงข้อมูลจาก Harddisk อีกตัวหนึ่งมาใช้งานได้ตามปกติ สำหรับ RAID Controller ที่ถูกออกแบบมาเป็นอย่างดีแล้ว การเขียนข้อมูลลง Harddisk 2 ตัวในเวลาเดียวกัน จะใช้เวลาพอๆ กับการเขียนข้อมูลลง Harddisk ตัวเดียว ในขณะที่เวลาในการอ่านก็จะน้อยลง เพราะ RAID Controller จะเลือกอ่านข้อมูลจาก Harddisk ตัวไหนก็ได้ โดยหากมีคำสั่งให้อ่านข้อมูล 2 ชุดในเวลาเดียวกัน ตัว RAID Controller ก็สามารถประมวลผลคำสั่งเพื่ออ่านข้อมูลจาก Harddisk ตัวหนึ่ง และคำสั่งอีกชุดนึงจาก Harddisk อีกตัวนึงก็ได้

จุดเด่นของ RAID 1 คือ ความปลอดภัยของข้อมูล ไม่เน้นเรื่องประสิทธิภาพ และความเร็วเหมือนอย่าง RAID 0 แม้ว่าประสิทธิภาพในการอ่านข้อมูลของ RAID 1 จะสูงขึ้นก็ตาม


RAID 2



   RAID 2 ข้อมูลทั้งหมดจะถูกตัดแบ่งเพื่อจัดเก็บลง Harddisk แต่ละตัวใน Disk Array โดยจะมี Harddisk ตัวหนึ่งเก็บข้อมูลที่ใช้ตรวจสอบ และแก้ไขข้อผิดพลาด (ECC - Error Checking and Correcting) ซึ่งเป็นการลดเปอร์เซ็นต์ที่ข้อมูลจะเสียหายหรือสูญเสียไป เมื่อมีการส่งข้อมูลไปบันทึกใน Disk Array จะเห็นได้ว่ามี Harddisk ที่เอาไว้เก็บค่า ECC โดยเฉพาะ ถ้าเกิดการปรากฏว่า Harddisk ตัวใดตัวหนึ่งเสียหาย ระบบก็จะสามารถสร้างข้อมูลทั้งหมดใน Harddisk ตัวนั้นขึ้นมาได้ใหม่ โดยอาศัยข้อมูลจาก Harddisk ตัวอื่นๆ และจากค่า ECC ที่เก็บเอาไว้ ซึ่งการทำ ECC นี้ส่งผลให้ Harddisk ทั้งระบบต้องทำงานค่อนข้างมากทีเดียว และ RAID 2 นั้นจะเห็นได้ว่าต้องใช้ Harddisk จำนวนมากในการเก็บค่า ECC ซึ่งทำให้ค่อนข้างสิ้นเปลืองครับ



RAID 3



   RAID 3 มีลักษณะที่คล้ายกับ RAID 2 แต่แทนที่จะตัดแบ่งข้อมูลในระดับ Bit เหมือน RAID 2 ก็จะตัดเก็บข้อมูลในระดับ Byte แทนและการตรวจสอบ และแก้ไขข้อผิดพลาดของข้อมูล จะใช้ Parity แทนที่จะเป็น ECC ทำให้ RAID 3 มีความสามารถในการอ่าน และเขียนข้อมูลได้อย่างรวดเร็ว เพราะมีการต่อ Harddisk แต่ละตัวแบบ Stripe และใช้ Harddisk ที่เก็บ Parity เพียงแค่ตัวเดียวเท่านั้น แต่ถ้านำ RAID 3 ไปใช้ในงานที่มีการส่งผ่านข้อมูลในจำนวนที่น้อยๆ ซึ่ง RAID 3 ต้องกระจายข้อมูลไปทั่วทั้ง Harddisk จะทำให้เกิดปัญหาที่เรียกว่า คอขวด ขึ้นกับ Harddisk ที่เก็บ Parity เพราะไม่ว่าข้อมูลจะมีขนาดใหญ่ขนาดไหน RAID 3 ต้องเสียเวลาไปสร้างส่วน Parity ทั้งสิ้น ยิ่งข้อมูลมีขนาดเล็กๆ แต่ Parity ต้องสร้างขึ้นตลอด ทำให้ข้อมูลถูกจัดเก็บเสร็จก่อนการสร้าง Parity ทั้งระบบต้องมารอให้สร้าง Parity เสร็จก่อน จึงจะทำงานต่อไปได้นั่นเอง

RAID 3 เหมาะสำหรับใช้ในงานที่มีการส่งข้อมูลจำนวนมากๆ เช่นงานตัดต่อ Video เป็นต้น



RAID 4



   RAID 4 มีลักษณะโดยรวมเหมือนกับ RAID 3 ทุกประการ ยกเว้นเรื่องการตัดแบ่งข้อมูลที่ทำในระดับ Block แทนที่จะเป็น Bit หรือ Byte ซึ่งทำให้การอ่านข้อมูลแบบ Random ทำได้รวดเร็วกว่า อย่างไรก็ตาม ปัญหาคอขวดที่กล่าวใน RAID 3 ก็ยังมีโอกาสเกิดขึ้นเหมือนเดิมครับ



RAID 5



   มีการตัดแบ่งข้อมูลในระดับ Block เช่นเดียวกับ RAID 4 แต่จะไม่ทำการแยก Harddisk ตัวใดตัวหนึ่งเพื่อเก็บ Parity ในการเก็บ Parity ของ RAID 5 นั้น จะกระจาย Parity ไปยัง Harddisk ทุกตัว โดยปะปนไปกับข้อมูลปกติ จึงช่วยลดปัญหาคอขวด ซึ่งเป็นปัญหาที่สำคัญใน RAID 3 และ RAID 4 คุณสมบัติอีกอันหนึ่งที่น่าสนใจของ RAID 5 คือ เทคโนโลยี Hot Swap คือ เราสามารถทำการเปลี่ยน Harddisk ในกรณีที่เกิดปัญหาได้ในขณะที่ระบบยังทำงานอยู่ เหมาะสำหรับงาน Server ต่างๆ ที่ต้องทำงานต่อเนื่อง


RAID 6



   RAID 6 อาศัยพื้นฐานการทำงานของ RAID 5 เกือบทุกประการ แต่มีการเพิ่ม Parity Block เข้าไปอีก 1 ชุด เพื่อยอมให้เราทำการ Hot Swap ได้พร้อมกัน 2 ตัว (RAID 5 ทำการ Hot Swap ได้ทีละ 1 ตัวเท่านั้น หาก Harddisk มีปัญหาพร้อมกัน 2 ตัว จะทำให้เสียทั้งระบบ) เรียกว่าเป็นการเพิ่ม Fault Tolerance ให้กับระบบ โดย RAID 6 เหมาะกับงานที่ต้องการความปลอดภัย และเสถียรภาพของข้อมูลที่สูงมากๆ



RAID 7



   RAID 7 อาศัยพื้นฐานการทำงานของ RAID 4 โดนเพิ่มคุณสมบัติบางอย่างเข้าไป เพื่อทำให้ Harddisk แต่ละตัวทำงานอิสระต่อกัน ไม่จำเป็นต้องรอให้ Harddisk ตัวใดตัวหนึ่งทำงานเสร็จก่อน (ซึ่งทำให้เกิดปัญหาคอขวดใน RAID 4) โดยการส่งข้อมูลแต่ละครั้ง จะทำการส่งผ่าน X-Bus ซึ่งเป็นบัสที่มีความเร็วสูง RAID 7 ยังมีหน่วยความจำแคชหลายระดับในตัว RAID Controller เพื่อแยกการทำงานให้อิสระต่อกัน โดยจะมี Real-Time Operating System อยู่ภายในส่วนที่เรียกว่า Array Control Processor ทำหน้าที่ควบคุมการส่งข้อมูลบนบัส

RAID 7 เหมาะสำหรับใช้ในองค์กรขนาดใหญ่ เชื่อมต่อได้สูงสุดถึง 12 Host 48 Drives และราคาของระบบ RAID 7 ค่อนข้างที่จะสูงมาก ด้วย RAID 7 เป็นลิขสิทธิ์เฉพาะของบริษัท Storage Computer Corporation ทำให้ผู้ใช้งาน RAID 7 ไม่สามารถปรับแต่งอะไรกับเครื่องเลย ทำให้ RAID 7 ไม่ค่อยได้รับความนิยมมากนัก



RAID 10



   RAID 10 หรือ RAID 0+1 เป็นการผสมผสานระหว่าง RAID 0 และ RAID 1 เข้าด้วยกัน ทำให้การเข้าถึงข้อมูลเป็นไปได้อย่างรวดเร็ว และมีการทำ Mirror ข้อมูล (Backup ข้อมูล) ไปด้วย ข้อเสียของ RAID 10 คือการเพิ่มจำนวน Harddisk ในอนาคตเป็นไปได้ยาก เพราะ Harddisk แต่ละตัวมี Mirror เป็นของตัวเอง ยิ่งเพิ่ม Harddisk เพื่อใช้งานก็ต้องเพิ่ม Harddisk เพื่อ Backup ไปด้วย เหมาะสำหรับ Server ที่ต้องการความเร็วในการเข้าถึงข้อมูลค่อนข้างมาก และไม่ต้องการความจุมากนัก



RAID 53



   RAID 53 มีอัตราความเร็วการเข้าถึงข้อมูลค่อนข้างสูง เพราะมีพื้นฐานการทำงานของ RAID 0 อยู่ และมีการป้องกันความเสียหายที่จะเกิดขึ้นได้ เหมือน RAID 3 ซึ่งแน่นอนว่ายังมีปัญหาคอขวดด้วย นอกจากนี้ RAID 53 ยังสามารถทำ Hot Swap ได้เหมือนใน RAID 5 ครับ


ความคิดเห็น

โพสต์ยอดนิยมจากบล็อกนี้

สัญลักษณ์ Flowchart

WINS คืออะไร ทำงานอย่างไร และต่างจาก DNS อย่างไร

RTO & RPO คืออะไร