SMART คืออะไรและจะใช้ทำนายความล้มเหลวของ HDD หรือ SSD ได้อย่างไร

พวกเราหลายคนเคยประสบกับความล้มเหลวของฮาร์ดดิสก์หรือ SSD พวกเราบางคนถึงกับพยายามค้นหาข้อมูลเพิ่มเติมเกี่ยวกับความน่าเชื่อถือของฮาร์ดไดรฟ์และฟังก์ชันการคาดการณ์ที่ซ่อนอยู่(hidden prediction function)ซึ่งเป็นส่วนหนึ่งของเทคโนโลยีที่เรียกว่าSMART อาจมีคนโต้แย้งว่าSMARTไม่น่าเชื่อถือเท่ากับไม่ได้ทำนายความล้มเหลวในทุกกรณี ความจริงข้อนี้เป็นความจริงบางส่วน แต่การทำงานภายในที่แท้จริงของระบบตรวจสอบตนเองนี้ไม่ง่ายนัก ดังนั้น เรามาตรวจสอบว่าSMARTทำงานอย่างไร นอกจากนี้เรายังจะแสดงวิธีตรวจสอบสถานะ HDD SMART(HDD SMART status)รวมถึงสถานะ SMART(SMART status) ของไดรฟ์โซลิดสเทต :

SMART (HDD & SSD) คืออะไร?

SMART เป็นระบบที่ตรวจสอบข้อมูลภายในของไดรฟ์ของคุณ (SMART is a system that monitors the internal information of your drive.)ชื่ออันชาญฉลาด(clever name)ของมันคือคำย่อของSelf-Monitoring, Analysis และ Reporting(Self-Monitoring, Analysis, and Reporting Technology) Technology SMARTหรือเขียนว่าSMARTเป็นเทคโนโลยีที่พบในHDD และ(HDDs and SSDs) SSD เป็นอิสระจากระบบปฏิบัติการ(operating system)ไบออส(BIOS)หรือซอฟต์แวร์อื่นๆ

SMARTทำอะไรกับHDD และ SSD(HDDs and SSDs)ได้บ้าง

SMARTถูกประดิษฐ์ขึ้นเนื่องจากคอมพิวเตอร์ต้องการสิ่งที่สามารถตรวจสอบสถานะสุขภาพ(health state)ของฮาร์ดไดรฟ์ได้ นั่นหมายความว่า พูดง่ายๆ ว่าSMART ควรจะสามารถบอกคุณได้ว่าฮาร์ดไดรฟ์หรือโซลิดสเตตไดรฟ์ของคุณกำลังจะหยุดทำงาน(SMART should supposedly be able to tell you if your hard drive or solid-state drive is about to stop working) !

ข้อมูลสุขภาพของไดรฟ์จัดทำโดย SMART

SMARTทำอย่างไร? คุณอาจถูกล่อลวงให้คิดว่าSMARTสามารถเดาได้อย่างน่าอัศจรรย์ว่าไดรฟ์ของคุณแข็งแรงหรือไม่ 🙂 สิ่งที่ทำคือเรื่องราวที่แตกต่างไปจากเดิมอย่างสิ้นเชิง SMART ติดตามชุดของตัวแปร(SMART keeps track of a series of variables)ซึ่งจำนวนและประเภทแตกต่างกันไปตามแต่ละไดรฟ์ ซึ่งเป็น ตัวบ่งชี้ความ น่าเชื่อถือ (indicators of its reliability)หากคุณต้องการทราบข้อมูลเชิงลึกเกี่ยวกับ แอตทริบิวต์ SMART ทั้งหมด เนื่องจากมีประมาณ 50 รายการ ( อัตราข้อผิดพลาด ในการอ่านข้อมูลดิบ เวลาในการหมุน รายงานข้อผิดพลาดที่ไม่สามารถแก้ไขได้ เวลาเปิดเครื่อง (error rate)จำนวนรอบ(cycle count)การโหลดฯลฯ) , เยี่ยมชมหน้าเว็บ(visit this webpage)นี้

อย่างไรก็ตาม โปรดทราบว่า นอกเหนือจากความพยายามบางอย่าง ( Google , Backblaze ) ส่วนใหญ่ของSMART ข้อมูลไม่มีเอกสาร ระบบให้ข้อมูลภายในจำนวนมาก ยังคงมีความไม่สอดคล้องกันหลายประการในสถิติเนื่องจากผู้ผลิตฮาร์ดไดรฟ์หลายรายใช้คำจำกัดความและการวัดที่แตกต่างกัน ตัวอย่างเช่น ผู้ผลิตบางรายจัดเก็บข้อมูลตรงเวลาของพลังงานเป็นชั่วโมง ในขณะที่ผู้ผลิตรายอื่นๆ วัดเป็นนาทีหรือวินาที นอกจากนี้ พวกเขาไม่ได้อธิบายว่าคุณลักษณะหรือตัวแปรต่างๆ ใดที่คุ้มค่ากับความสนใจของเรา ทำให้เราจมลงในข้อมูล

ก่อนที่จะพยายามทำความเข้าใจว่า แอตทริบิวต์ SMARTใดที่เกี่ยวข้อง ก่อนอื่นเราต้องแยกความแตกต่างระหว่างประเภทหลักของความล้มเหลวของ SSD และ HDD: คาดการณ์ได้ และคาดเดาไม่(SSD and HDD failures: predictable and non-predictable)ได้

รายละเอียด SMART สำหรับไดรฟ์โซลิดสเทต

ความล้มเหลวที่คาดการณ์ได้(Predictable failures)รวมถึงการพังที่ปรากฏขึ้นทันเวลาและเกิดจากกลไกของดิสก์ที่ผิดพลาดหรือความเสียหายของพื้นผิวของดิสก์ในกรณีของฮาร์ดดิสก์ สำหรับไดรฟ์โซลิดสเทต ความล้มเหลวที่คาดการณ์ได้อาจรวมถึงการสึกหรอตามปกติเมื่อเวลาผ่านไป หรือการพยายามลบหลายครั้งที่ล้มเหลว ปัญหา(Problems)จะแย่ลงเมื่อเวลาผ่านไป และในที่สุดไดรฟ์ก็ล้มเหลว

ความล้มเหลวที่คาดเดาไม่(Non-predictable failures)ได้เกิดจากเหตุการณ์กะทันหัน ซึ่งเราสามารถพูดถึงได้ เช่น ไฟกระชากอย่างกะทันหันหรือความเสียหายที่ไม่คาดคิดต่อวงจรภายในฮาร์ดดิสก์หรือไดรฟ์โซลิดสเทต สิ่งสำคัญที่ต้องเข้าใจคือSMART สามารถช่วยคุณตรวจจับความล้มเหลวที่คาดการณ์(S.M.A.R.T. can only help you detect predictable failures)ได้เท่านั้น

เมื่อคุณมีความเข้าใจพื้นฐานแล้วว่าSMARTคืออะไรและใช้ทำอะไร มาดูวิธีตรวจสอบสถานะ SMART(SMART status)ของไดรฟ์ของคุณจากWindowsและวิธีการอ่านและตีความรายละเอียดSMART กัน:(SMART)

วิธีตรวจสอบสถานะ SSD และ HDD SMART(SSD and HDD SMART status)

ใน คอมพิวเตอร์และอุปกรณ์ Windowsวิธีที่ง่ายที่สุดในการอ่าน ข้อมูล SMARTจากฮาร์ดดิสก์หรือจากSSDคือการใช้แอปเฉพาะทาง มีค่อนข้างน้อย แต่ส่วนมากมีการพัฒนาไม่ดีหรือเสียเงิน (cost money)จากแอปทั้งหมดที่สามารถอ่าน ข้อมูล SMART ได้ แอปที่ ดีที่สุดและแอปที่เราแนะนำให้คุณใช้คือCrystalDiskInfo ฟรี สามารถอ่าน คุณสมบัติ SMARTและเป็นหนึ่งในไม่กี่แอพดังกล่าวที่สามารถรับ ข้อมูล SMARTทั้งจากIDE ( PATA ), SATAและNVMeไดรฟ์ รวมทั้งจากไดรฟ์แบบพกพาที่ใช้ e SATA , USBหรือIEEE 1394(IEEE 1394)

CrystalDiskInfo แสดงข้อมูลโดยละเอียดเกี่ยวกับไดรฟ์โดยใช้ SMART

อีกวิธีที่ยอดเยี่ยมในการตรวจสอบสถานะ SMART และรายละเอียด(SMART status and details)ของHDD หรือ SSD(HDD or SSD)คือการใช้แอพที่ผู้ผลิตให้มา ตัวอย่างเช่น โซลิดสเทตไดรฟ์ส่วนใหญ่จะมาพร้อมกับแอพสนับสนุน(support apps)ที่ให้คุณตรวจสอบข้อมูล ตรวจสุขภาพ เรียกใช้การวินิจฉัย และอื่นๆ แอปเหล่านี้มักมีตัวเลือกสำหรับตรวจสอบสถานะSMART(SMART status)

ผู้ผลิตไดรฟ์เสนอแอปที่สามารถอ่านข้อมูล SMART ได้

วิธีที่สามในการตรวจสอบสถานะ SMART(SMART status)ของฮาร์ดดิสก์ไดรฟ์หรือ SSD(disk drive or SSD) ของ คุณมีให้ในWindows 10 ไม่แสดงรายละเอียด แต่สามารถบอกคุณได้ว่าสถานะ SMART(SMART status)ของไดรฟ์ของคุณนั้นใช้ได้หรือไม่ ในการตรวจสอบSMARTให้เปิดCommand Promptและเรียกใช้คำสั่งนี้: wmic diskdrive get model,(wmic diskdrive get model, status) status คำสั่งจะแสดงรายการไดรฟ์ที่เชื่อมต่อกับพีซีของคุณและแสดงสถานะ SMART(SMART status)สำหรับแต่ละ ไดรฟ์

Windows 10 ให้คุณตรวจสอบสถานะ SMART ของไดรฟ์ของคุณ

วิธีสุดท้ายนี้ในการตรวจสอบสถานะ SMART(SMART status)น่าจะเป็นวิธีที่เร็วที่สุดในWindows 10เพื่อตรวจสอบว่าไดรฟ์ของคุณล้มเหลวหรือไม่

วิธีเรียกใช้การทดสอบ SSD หรือ HDD SMART

หากคุณไม่พอใจกับการอ่านสถานะ SMART(SMART status)ของไดรฟ์ คุณสามารถเรียกใช้การทดสอบ SSD หรือ HDD SMART(SSD or HDD SMART test)ได้ พูดง่ายกว่าทำเพราะคุณต้องการแอปเฉพาะเพื่อการนี้ ดังนั้นเราจึงพิจารณาว่านี่เป็นหัวข้อที่คุ้มค่าสำหรับบทความแยกต่างหาก ซึ่งคุณสามารถเข้าถึงได้ผ่านลิงก์นี้: ทดสอบHDD หรือ SSD(HDD or SSD) ของ คุณและตรวจสอบสถานะสุขภาพ(health status)

วิธีอ่านค่าและคุณลักษณะของSMART

สถานะความ(health status)สมบูรณ์ของฮาร์ดดิสก์ได้รับการทดสอบและตรวจสอบอย่างต่อเนื่องด้วยเซ็นเซอร์หลายตัว ค่าจะถูกวัดโดยการใช้อัลกอริธึมทั่วไป จากนั้นแอตทริบิวต์ที่เกี่ยวข้องจะถูกปรับแต่งตามผลลัพธ์

ใน โปรแกรมตรวจสอบ(monitoring program) SMART ใด ๆคุณควรเห็นแอตทริบิวต์ที่มีฟิลด์เหล่านี้อย่างน้อยบางส่วน:

  • ตัวระบุ:(Identifier:)คำจำกัดความของแอตทริบิวต์ โดยปกติแล้วจะมีความหมายมาตรฐาน และมีเครื่องหมายตัวเลขระหว่าง 1 ถึง 250 (เช่น 9 คือPower-on Count ) อย่างไรก็ตามเครื่องมือตรวจสอบและทดสอบดิสก์(disk monitoring and testing tools) ทั้งหมด มีชื่อและคำอธิบายที่เป็นข้อความของแอตทริบิวต์
  • เกณฑ์:(Threshold:)ค่าต่ำสุดสำหรับแอตทริบิวต์ หากถึงค่านี้ แสดงว่าไดรฟ์ของคุณกำลังจะล้มเหลว
  • ค่า:(Value:)ค่าปัจจุบันของแอตทริบิวต์ อัลกอริทึมจะคำนวณตัวเลขนี้ตามข้อมูลดิบ ฮาร์ดไดรฟ์ใหม่ควรมีตัวเลขสูง ค่าสูงสุดตามทฤษฎี (100, 200 หรือ 253 ขึ้นอยู่กับผู้ผลิต) ซึ่งจะลดลงตลอดอายุการใช้งาน
  • แย่ที่สุด:(Worst:)ค่าแอตทริบิวต์ที่น้อยที่สุดที่เคยบันทึกไว้
  • ข้อมูล:(Data:)ค่าที่วัดได้ดิบโดยเซ็นเซอร์หรือตัวนับ นี่คือข้อมูลที่ใช้โดยอัลกอริทึมที่ออกแบบโดยผู้ผลิต HDD หรือSSD (HDD or SSD)เนื้อหาขึ้นอยู่กับคุณลักษณะและผู้ผลิตไดรฟ์ ผู้ใช้ทั่วไปควรข้ามสิ่งนี้
  • แฟล็ก:(Flags:)จุดประสงค์ของแอตทริบิวต์ ผู้ผลิต มักจะเป็นผู้กำหนดดังนั้นจึงแตกต่างกันไป(manufacturer and therefore varies) ในแต่ละ ไดรฟ์ แต่ละแอตทริบิวต์มีความสำคัญและสามารถคาดการณ์ความล้มเหลวที่จะเกิดขึ้นได้ (เช่น จำนวนID 5ที่จัดสรรใหม่) หรือทางสถิติที่ไม่มีผลกระทบโดยตรงต่อสถานะ (เช่นID 174 จำนวนการสูญเสียพลังงาน(power loss count)ที่ไม่คาดคิด)

แอตทริบิวต์ SMART อธิบายโดยข้อมูล เช่น ID ค่าปัจจุบัน ค่าที่แย่ที่สุด และขีดจำกัด

เมื่อพยายามทำความเข้าใจสถานะของแอตทริบิวต์ SMART ใดๆ ให้ตรวจสอบค่าของสามฟิลด์เหล่านี้: value, threshold และ(to understand the status of any S.M.A.R.T. attribute, check the values of these three fields: value, threshold, and flags) flags นอกจากนี้ โปรดจำไว้ว่า โดยปกติค่าที่น้อยกว่าบ่งชี้ถึงความเชื่อถือได้ที่ลด(smaller values are an indication of a decrease in reliability)ลง

วิธีใช้SMARTเพื่อทำนายความล้มเหลวของHDD หรือ SSD(HDD or SSD) (ค่าสำคัญที่ต้องตรวจสอบ)

ไม่ สมาร์ (S.M.A.R.T)ทั้งหมด คุณลักษณะมีความสำคัญต่อการทำนายความล้ม(failure prediction)เหลว การศึกษาทั้งสองที่กล่าวถึงข้างต้นเกี่ยวกับ อัตรา ความล้มเหลวของฮาร์ดไดรฟ์(drive failure)และแหล่งอื่น ๆ ยอมรับว่าความช่วยเหลือที่สำคัญในการระบุไดรฟ์ที่ล้มเหลวคือ:

  • จำนวนเซ(Reallocated sector counts) กเตอร์ที่จัดสรร ใหม่ การจัดสรรใหม่เกิดขึ้นเมื่อลอจิกของไดรฟ์ทำการแมปเซกเตอร์ที่เสียหาย อันเป็นผลมาจากข้อผิดพลาดซอฟต์หรือฮาร์ดที่เกิดซ้ำกับเซกเตอร์กายภาพใหม่จากเซกเตอร์สำรอง คุณลักษณะนี้สะท้อนถึงจำนวนครั้งที่เกิดการรีแมป หากค่าของมันเพิ่มขึ้น แสดงว่า HDD หรือ SSD สึกหรอ

  • จำนวนภาคที่รอดำเนินการใน(Current Pending Sector Count)ปัจจุบัน สิ่งนี้นับเซกเตอร์ที่ "ไม่เสถียร" ซึ่งหมายความว่าส่วนที่เสียหายซึ่งมีข้อผิดพลาดในการอ่านซึ่งกำลังรอการแมปใหม่ ซึ่งเป็นระบบ "ทดลองงาน" ชนิดหนึ่ง อัลกอริธึม SMART มีความเข้าใจที่หลากหลายเกี่ยวกับคุณลักษณะเฉพาะนี้ เนื่องจากบางครั้งอาจไม่น่าเชื่อถือ ถึงกระนั้นก็สามารถให้การเตือนล่วงหน้าถึงปัญหาที่อาจเกิดขึ้นได้

  • รายงานข้อผิดพลาด(Reported Uncorrectable Errors)ที่ไม่สามารถแก้ไขได้ เป็นการนับข้อผิดพลาดที่ไม่สามารถกู้คืนได้ และมีประโยชน์เพราะดูเหมือนว่าจะมีความหมายเหมือนกันสำหรับผู้ผลิตทุกราย

  • (Erase Fail Count)ลบFail Count อันนี้เป็นตัวบ่งชี้ที่ยอดเยี่ยมของการเสียชีวิตก่อนวัยอันควรของไดรฟ์โซลิดสเทต โดยจะนับจำนวนครั้งที่พยายามลบข้อมูลที่ล้มเหลว และค่าที่เพิ่มขึ้นจะบอกคุณว่าหน่วยความจำแฟลชภายใน SSD ใกล้จะหมดอายุการใช้งานแล้ว

  • สวมจำนวน(Wear Leveling Count)การปรับระดับ สิ่งนี้มีประโยชน์อย่างยิ่งสำหรับ SSD เช่นกัน ผู้ผลิตกำหนดอายุการใช้งานที่คาดหวังของ SSD ในข้อมูล SMART Wear Leveling Countเป็นการประมาณความสมบูรณ์ของการขับขี่ของคุณ คำนวณโดยใช้อัลกอริธึมที่คำนึงถึงอายุการใช้งานที่คาดไว้ล่วงหน้าและจำนวนรอบ (เขียน ลบ ฯลฯ) ที่บล็อกแฟลชหน่วยความจำแต่ละบล็อกสามารถทำได้ก่อนที่จะหมดอายุการใช้งาน

  • อุณหภูมิของดิสก์(Disk temperature)เป็นพารามิเตอร์ที่มีการถกเถียงกันอย่างมาก อย่างไรก็ตาม ค่าที่สูงกว่า 60°C สามารถลดอายุการใช้งานของ HDD หรือ SSD และเพิ่มโอกาสเกิดความเสียหายได้ เราขอแนะนำให้ใช้พัดลมเพื่อลดอุณหภูมิของไดรฟ์และหวังว่าจะสามารถยืดอายุการใช้งานของไดรฟ์ได้

ค่า SMART ที่สูงกว่าเกณฑ์อาจบ่งชี้ถึงความล้มเหลวของไดรฟ์ในอนาคต

SMARTที่กล่าวถึงข้างต้น คุณลักษณะค่อนข้างง่ายต่อการตีความ หากคุณสังเกตเห็นค่าที่เพิ่มขึ้น อาจเป็นไปได้ว่าไดรฟ์ของคุณเสีย ดังนั้นคุณควรเริ่มสำรองข้อมูล อย่างไรก็ตาม แม้ว่าสิ่งเหล่านี้จะเป็นตัวบ่งชี้ที่มีประโยชน์เกี่ยวกับความน่าเชื่อถือของไดรฟ์ แต่อย่าลืมว่าสิ่งเหล่านี้ไม่สามารถป้องกันความผิดพลาดได้

บันทึกทางประวัติศาสตร์เกี่ยวกับ SMART

SMARTได้รับการพัฒนาโดยเริ่มตั้งแต่ปี 1992(year 1992)ถึงแม้ว่าตอนนี้คุณจะทราบแล้วว่า SMART รวมอยู่ในโซลิดสเตตไดรฟ์และฮาร์ดดิสก์ไดรฟ์ที่ทันสมัยทั้งหมด ประวัติของบริษัทครอบคลุมชื่อต่างๆ เช่นPredictive Failure Analysis หรือ IntelliSafe(Predictive Failure Analysis or IntelliSafe)และข้อมูลจากผู้ผลิตฮาร์ดดิสก์รายใหญ่ทั้งหมด: IBM ,(IBM) Seagate ,(Seagate) Quantum ,(Quantum) Western Digital (Western Digital)ในที่สุด เอกสารของมันถูกนำเสนอเป็นครั้งแรกในปี 2547 ภายใน มาตรฐาน Parallel ATAและได้รับการแก้ไขตามปกติในภายหลัง ล่าสุดออกในปี 2554

มีอะไรอีกบ้างที่คุณอยากรู้เกี่ยวกับSSD และ HDD SMART(SSD and HDD SMART) ?

นี่เป็นการศึกษาสั้นๆ ของเราเกี่ยวกับการทำงานภายในของSMARTและความสามารถในการตรวจสอบ ทดสอบ และคาดการณ์ความล้มเหลวของฮาร์ดดิสก์ มุมมองหลักที่คุณควรจำไว้ก็คือระบบตรวจสอบตัวเองนี้สามารถช่วยคุณตรวจสอบสถานะ(health status) ความสมบูรณ์ ของHDD ของคุณ ได้ หากคุณต้องการใช้ข้อมูล SMART(S.M.A.R.T data) นี้ เพื่อดูว่าไดรฟ์ของคุณมีปัญหาหรือไม่ โปรดอ่านบทความที่เราแนะนำในบทช่วยสอนนี้ สำหรับคำถาม ใช้แบบฟอร์มความคิดเห็นด้านล่าง แล้วมาพูดคุยกัน



About the author

ฉันเป็นผู้ตรวจทานมืออาชีพและเพิ่มประสิทธิภาพการทำงาน ฉันชอบใช้เวลาออนไลน์เล่นวิดีโอเกม สำรวจสิ่งใหม่ ๆ และช่วยเหลือผู้คนเกี่ยวกับความต้องการด้านเทคโนโลยีของพวกเขา ฉันมีประสบการณ์กับ Xbox มาบ้างแล้วและได้ช่วยเหลือลูกค้าในการรักษาระบบของพวกเขาให้ปลอดภัยมาตั้งแต่ปี 2552



Related posts