প্রশ্ন একটি হার্ডওয়্যার SATA RAID-10 অ্যারের মধ্যে একটি ডিস্ক কীভাবে সমগ্র অ্যারেকে স্ক্রীচিং হটে আনতে পারে?


প্রস্তাবনা:

আমি একটি কোড-বানর যা ক্রমাগত আমার ছোট কোম্পানির জন্য SysAdmin দায়িত্ব গ্রহণ করা হয়। আমার কোড আমাদের পণ্য, এবং ক্রমবর্ধমান আমরা SaaS হিসাবে একই অ্যাপ্লিকেশন প্রদান।

প্রায় 18 মাস আগে আমি আমাদের সার্ভারগুলিকে একটি প্রিমিয়াম হোস্টিং কেন্দ্রিক বিক্রেতার কাছ থেকে একটি টিয়ার IV ডাটা সেন্টারে একটি বেয়ারবোন র্যাক পেষণকারীতে স্থানান্তরিত করেছিলাম। (আক্ষরিক রাস্তায় জুড়ে।) এটি আমাদের নিজেদেরকে আরো অনেক কিছু করার পরামর্শ দেয় - নেটওয়ার্কিং, সঞ্চয়স্থান এবং পর্যবেক্ষণের মতো জিনিস।

হোস্টিং কোম্পানির কাছ থেকে আমাদের লিটড সরাসরি সংযুক্ত স্টোরেজ প্রতিস্থাপনের জন্য বড় পদক্ষেপের অংশ হিসাবে, আমি সুপারমাইকো চ্যাসি, 3ওয়্যার RAID কার্ড, উবুন্টু 10.04, দুই ডজন SATA ডিস্ক, ডিআরবিডি এবং এর উপর ভিত্তি করে একটি 9 টিবি দুই নোড NAS তৈরি করেছি। এটি সব প্রেমময়ভাবে তিনটি ব্লগ পোস্টে নথিভুক্ত করা হয়: নতুন 9টিবি স্যাটেলাইট RAID10 NFSv4 তৈরি ও পরীক্ষা করা হচ্ছে NAS: পার্ট আমি, পার্ট II এবং পার্ট III

আমরা একটি cacit পর্যবেক্ষণ সিস্টেম সেট আপ। সম্প্রতি আমরা SMART মানগুলির মতো আরো বেশি ডাটা পয়েন্ট যুক্ত করেছি।

আমি ছাড়া সব এই কাজ করতে পারে না অসাধারণ  boffins    ServerFault। এটি একটি মজার এবং শিক্ষাগত অভিজ্ঞতা হয়েছে। আমার বস খুশি (আমরা $$$ এর বালতি লোডগুলি সংরক্ষণ করেছি), আমাদের গ্রাহকদের খুশি (স্টোরেজ খরচ নিচে), আমি খুশি (মজা মজা মজা)

গতকাল পর্যন্ত।

আউটজেক এবং পুনরুদ্ধার:

মধ্যাহ্নভোজের কিছু সময় পরেই আমরা আমাদের অ্যাপ্লিকেশন থেকে অলস স্ট্রিমিং মিডিয়া সিএমএসের অলস কর্মক্ষমতা রিপোর্ট পেয়েছিলাম। প্রায় একই সময়ে আমাদের ক্যাকটি মনিটরিং সিস্টেম ইমেজ একটি ঝিল্লি পাঠানো। আরো বলার সতর্কতা এক Iostat অপেক্ষা গ্রাফ ছিল।

enter image description here

পারফরম্যান্স এত হিংস্র হয়ে উঠেছে যে পিংডমোম "সার্ভার ডাউন" বিজ্ঞপ্তিগুলি পাঠাতে শুরু করেছে। সামগ্রিক লোড মাঝারি, ট্রাফিক স্পাই ছিল না।

অ্যাপ্লিকেশন সার্ভারগুলিতে লগ ইন করার পরে, NAS এর NFS ক্লায়েন্ট, আমি নিশ্চিত করেছি যে সবকিছুই খুব বিরক্তিকর এবং অতিশয় দীর্ঘ সময় অপেক্ষা করছে। এবং একবার আমি প্রাথমিক NAS নোডের সম্মুখের দিকে যাওয়ার আশা করি, সমস্যার অ্যারের ফাইল সিস্টেম নেভিগেট করার চেষ্টা করার সময় একই বিলম্বগুলি স্পষ্ট ছিল।

সময় ব্যর্থ, যে ভাল গিয়েছিলাম। 20 মিনিটের মধ্যে সবকিছু ব্যাক আপ এবং পুরোপুরি চলমান নিশ্চিত করা হয়েছে।

ময়নাতদন্তের:

কোন এবং সমস্ত সিস্টেম ব্যর্থতার পরে আমি ব্যর্থতার কারণ নির্ধারণ করার জন্য একটি পোস্ট মর্মে সঞ্চালন। আমি প্রথম জিনিসটি ssh বক্সে ফিরে ছিল এবং লগ পর্যালোচনা শুরু। এটা সম্পূর্ণরূপে অফলাইন ছিল। তথ্য কেন্দ্র একটি ট্রিপ জন্য সময়। হার্ডওয়্যার রিসেট, ব্যাকআপ এবং চলমান।

মধ্যে /var/syslog আমি এই ভীতিকর খুঁজছেন এন্ট্রি খুঁজে পাওয়া যায় নি:

Nov 15 06:49:44 umbilo smartd[2827]: Device: /dev/twa0 [3ware_disk_00], 6 Currently unreadable (pending) sectors
Nov 15 06:49:44 umbilo smartd[2827]: Device: /dev/twa0 [3ware_disk_07], SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 171 to 170
Nov 15 06:49:45 umbilo smartd[2827]: Device: /dev/twa0 [3ware_disk_10], 16 Currently unreadable (pending) sectors
Nov 15 06:49:45 umbilo smartd[2827]: Device: /dev/twa0 [3ware_disk_10], 4 Offline uncorrectable sectors
Nov 15 06:49:45 umbilo smartd[2827]: Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
Nov 15 06:49:45 umbilo smartd[2827]: # 1  Short offline       Completed: read failure       90%      6576         3421766910
Nov 15 06:49:45 umbilo smartd[2827]: # 2  Short offline       Completed: read failure       90%      6087         3421766910
Nov 15 06:49:45 umbilo smartd[2827]: # 3  Short offline       Completed: read failure       10%      5901         656821791
Nov 15 06:49:45 umbilo smartd[2827]: # 4  Short offline       Completed: read failure       90%      5818         651637856
Nov 15 06:49:45 umbilo smartd[2827]:

সুতরাং আমি অ্যারে ডিস্ক জন্য ক্যাকটি গ্রাফ চেক করতে গিয়েছিলাম। এখানে আমরা দেখি, হ্যাঁ, ডিস্ক 7 স্লোগান করছে ঠিক যেমন syslog এটি বলে। কিন্তু আমরা দেখতে পাচ্ছি যে ডিস্ক 8 এর SMART Read Erros অপ্রচলিত।

enter image description here

Syslog এ ডিস্ক 8 সম্পর্কে কোন বার্তা নেই। আরো আকর্ষণীয় যে ডিস্ক 8 এর জন্য ক্রমবর্ধমান মান সরাসরি উচ্চ IO অপেক্ষা বারের সাথে সম্পর্কযুক্ত!  আমার ব্যাখ্যা হল যে:

  • ডিস্ক 8 একটি বিজোড় হার্ডওয়্যার ফল্ট সম্মুখীন হয় যা দীর্ঘমেয়াদী দীর্ঘ সময় অপারেশন ফলাফল।
  • যেকোনভাবে ডিস্কের এই ত্রুটিটি সম্পূর্ণ অ্যারের লক করা হচ্ছে

হয়তো আরো সঠিক বা সঠিক বিবরণ রয়েছে, কিন্তু নেট ফলাফলটি হল যে একটি ডিস্ক সমগ্র অ্যারের কর্মক্ষমতা প্রভাবিত করছে।

প্রস্নগুলা)

  • একটি হার্ডওয়্যার SATA RAID-10 অ্যারের মধ্যে একটি ডিস্ক কীভাবে সমগ্র অ্যারেকে স্ক্রীচিং হটে আনতে পারে?
  • আমি কি ভাবলাম না যে RAID কার্ডটি এর সাথে মোকাবিলা করা উচিত?
  • কিভাবে আমি একটি সম্পূর্ণ misbehaving ডিস্ক সম্পূর্ণ অ্যারে প্রভাবিত থেকে প্রতিরোধ করতে পারি?
  • আমি কিছু অনুপস্থিত করছি?

99
2017-11-16 11:14


উত্স


আপনার কাছ থেকে আরেকটি ভাল লেখা প্রশ্ন, +1। সর্বদা পড়া একটি পরিতোষ (কিন্তু দুর্ভাগ্যবশত আমার বোর্ড উপরে এমনকি একটি ধারণা আছে)। - tombull89
@ ডাফঃ এই সেটআপে চলমান বাজেট কিনুন আমরা এইচপি থেকে তুলনীয় একটি কঠিন 66% সংরক্ষণ করেছি। আমরা এই বাক্সে আপনার একটি বছর বর্ষের দিন রাখা, এটা আর স্থায়ী প্রয়োজন হবে না। মনে রাখবেন যে এটি একটি স্টোরেজ বক্স, বছরে প্লুমেট খরচ। - Stu Thompson
3Ware খারাপ নয়, প্রতি। আমি একটি ডেল সিস্টেমের একটি PERC কার্ড থেকে winky আচরণ আছে, যা শালীন সার্ভার হার্ডওয়্যার হতে অনুমিত হয়। 3Ware কার্ড অনবোর্ড ব্যাটারি এবং যেমন থাকা উচিত, তাই আমি সিদ্ধান্ত সম্পর্কে খুব খারাপ মনে হবে না। ঠিক আছে, আপনি SAS বনাম SATA সিদ্ধান্তের জন্য স্ল্যাম পেতে পারেন, কিন্তু আপনি তথ্য হারান না এবং আপনার প্রশ্ন থেকে আপনি ব্যাকআপ এবং জায়গায় নজরদারি করছেন বলে মনে হয়, তাই আপনি বেশ ভাল করছেন :-) - Bart Silverstrim
@StuThompson: অবশ্যই বাজেটে যেতে এবং কনজিউমার হার্ডওয়্যার ব্যবহার করা সস্তা, এবং প্রায়শই এটি জরিমানা করবে, বিশেষত যখন আপনার ক্ষেত্রে, এটির পিছনে একটি ভাল HA ধারণা রয়েছে। কিন্তু আপনি দেখান হিসাবে ক্ষেত্রে আছে, যেখানে খারাপ জিনিস ঘটবে যখন ভোক্তা হার্ডওয়্যার শুধু কাটা না। ভাল পার্স (ডেল) বা স্মার্টআরে (এইচপি) কন্ট্রোলারের উপর একটি ত্রুটিপূর্ণ SAS ডিস্কের প্রতি একটি প্রতিস্থাপন ডিস্ক পাওয়ার জন্য আপনাকে কোনও সমর্থন কল ছাড়া অন্য কোনও সমস্যা হতে পারে না বলে আমি আপনাকে অনেক গ্যারান্টি দিতে পারি। আমরা উত্পাদন বছর ধরে অনেক মৃত SAS ডিস্ক আছে কিন্তু তারা একটি সার্ভার নিচে না। - daff
সর্বাধিক SATA ডিস্ক TLER (টাইম লিমিটেড ত্রুটি পুনরুদ্ধার) সমর্থন করে না। যখন একটি সাধারণ SATA ডিস্ক একটি শারীরিক সমস্যা সম্মুখীন হয় তখন এটি ডিস্ক সাব-সিস্টেমে "এটিতে কাজ করে থাকাকালীন ধরে ধরে রাখে" (যা এটি সাধারণত বলে থাকে)। এরপর ডিস্কটি "আমি মরে" থ্রেশহোল্ডটি হিট না হওয়া পর্যন্ত প্রতিটি ত্রুটির উপরে 10-30 সেকেন্ড (সাধারণত) ব্যয় করতে এগিয়ে যাব। ডিএল ডিস্ক এবং SATA ডিস্কগুলি যেগুলি TLER সমর্থন করে তাদের ডিবি সাবসিস্টেম বলতে "এইচআইবিএ দ্বারা কনফিগার করা হয়েছে" আমি একটি সমস্যা পেয়েছি, আমার কী করা উচিত? তাই এইচবিএ মূলত অবিলম্বে উপযুক্ত পদক্ষেপ সিদ্ধান্ত নিতে পারেন। (সংক্ষিপ্তত্ব জন্য সরলীকৃত) - Chris S


উত্তর:


সমালোচনামূলক পরিবেশ পরিবেশে "SATA ব্যবহার করবেন না" বলে আমি ঘৃণা করি, তবে আমি এই পরিস্থিতিটি প্রায়শই দেখেছি। SATA ড্রাইভগুলি সাধারণত আপনি বর্ণিত চক্রের জন্য বোঝেন না, যদিও আপনি স্পেক করেছেন ড্রাইভ বিশেষভাবে 24x7 অপারেশন জন্য রেট আপনার সেটআপ। আমার অভিজ্ঞতা হল যে SATA ড্রাইভগুলি আনুমানিক উপায়ে ব্যর্থ হতে পারে, প্রায়শই সম্পূর্ণ স্টোরেজ অ্যারে প্রভাবিত করার সময়, এমনকি যখন আপনি RAID 1 + 0 ব্যবহার করছেন তখনও। কখনও কখনও ড্রাইভ এমনভাবে ব্যর্থ হয় যা সমগ্র বাসটিকে থামাতে পারে। উল্লেখ্য একটি জিনিস আপনি আপনার সেটআপ SAS প্রসারিতকারী ব্যবহার করছেন কিনা। যে ড্রাইভ ব্যর্থতা দ্বারা অবশিষ্ট ডিস্ক প্রভাবিত হয় কিভাবে একটি পার্থক্য করতে পারেন।

কিন্তু এটা দিয়ে যেতে আরো জ্ঞান করা হতে পারে মিডলাইন / আসল লাইন (7200 RPM) এসএএস ড্রাইভ বিপরীত SATA। SATA এর উপর একটি ছোট দাম প্রিমিয়াম আছে, তবে ড্রাইভগুলি আরো কার্যকরীভাবে চালানো / ব্যর্থ হবে। ত্রুটি-সংশোধন এবং SAS ইন্টারফেস / প্রোটোকলে রিপোর্টিংটি SATA সেটের চেয়ে আরও শক্ত। তাই ড্রাইভ সঙ্গে এমনকি যার যান্ত্রিক একই হয়, এসএএস প্রোটোকল পার্থক্য আপনার ড্রাইভ ব্যর্থতার সময় অভিজ্ঞ ব্যাথা প্রতিরোধ করতে পারে।


47
2017-11-16 11:48



আমি শুধু প্রশ্ন লিখছিলাম জানতাম এসএএস আমার পছন্দ আসছে যাচ্ছে। : / IOPS এবং throughput আমার সেটআপের ক্ষমতাগুলির মধ্যে ভাল। কিন্তু আমি আরও কিছু সূক্ষ্ম পার্থক্য সম্পূর্ণরূপে গ্রোক না। আমরা এই বাক্সে একটি 3 বছরের জীবনযাপন করা। পরবর্তী সময় এসএএস ব্যবহার করতে ভুলবেন না। - Stu Thompson
হ্যাঁ, এটা পরবর্তী সময় বিবেচনা কিছু। আমি উল্লিখিত নিকটবর্তী এসএএস ড্রাইভগুলি SATA এর চেয়ে ভালভাবে সঞ্চালন করতে চাই না, তবে এটি ত্রুটিগুলি পুনরুদ্ধার এবং ড্রাইভ ব্যর্থতার মতো যেখানে SAS বেশি পরিচালনাযোগ্য। আমার একটি সান ফায়ার x4540 48-ড্রাইভ SATA স্টোরেজ সিস্টেম 6 কন্ট্রোলার রয়েছে, এবং ব্যক্তিগত ড্রাইভ ব্যর্থতা সার্ভার লক করার পক্ষে থাকে। হার্ড পাঠ। - ewwhite
খনি একটি ভাল বন্ধু এন্টারপ্রাইজ স্টোরেজ বিশ্বের হয়। তিনি এই সব পড়া এবং বলেছেন "এই লোকটি ঠিক আছে। SATA কে একটি সম্পূর্ণ ব্যর্থতার জন্য ডিজাইন করা হয়েছে এবং একটি অন্তর্বর্তী ব্যক্তি ফায়ারওভার কার্যকর করার জন্য বাস w / o প্রয়োজন হবে। সাধারণত এটি কখনও দেখা যায় না কারণ সর্বাধিক SATA কনফিগারগুলি এক ড্রাইভ" - Stu Thompson
@StuThompson আপনি কি কাছ থেকে অনুলিপি এসএএস নিয়ে নতুন বক্স তৈরি করেছেন? আমি আপনার অভিজ্ঞতা সম্পর্কে পড়তে চাই। আপনার প্রশ্ন আমাকে অনেক আগেই সাহায্য করেছে, সম্ভবত ভবিষ্যতে আমি একই রকম একটি বক্স তৈরি করব। - chrishiestand
@ ক্রিশেস্ট্যান্ড না, আমি না। আমি 13 জানুয়ারিতে কোম্পানির ত্যাগ করলাম; যদি আমি থাকতাম আমরা কাছাকাছি লাইন সহ প্রতিস্থাপন বাক্স তৈরি করা হবে। আচ্ছা, নাসার অস্তিত্ব আমার কাছে খুব ঘনিষ্ঠভাবে আবদ্ধ ছিল এবং তথ্যটি পরিষেবা সরবরাহকারীর SAN এ সরানো হয়েছিল। - Stu Thompson


কিভাবে একটি একক ডিস্ক অ্যারে নিচে আনতে পারেন? উত্তরটি করা উচিত নয়, তবে এটির প্রসারের কারণ কী তা নির্ভর করে। যদি ডিস্কে আচরণের পথে মরতে হয়, তবে এটি হ্রাস করা উচিত নয়। কিন্তু এটি সম্ভব যে এটি "প্রান্ত কেস" পদ্ধতিতে ব্যর্থ হচ্ছে যা নিয়ামক পরিচালনা করতে পারে না।

আপনি এই না ঘটতে হবে মনে নির্বোধ? না, আমি তাই মনে করি না। একটি হার্ডওয়্যার RAID কার্ড যে বেশিরভাগ সমস্যা পরিচালনা করা উচিত।

কিভাবে এটি প্রতিরোধ করতে? আপনি এই মত অদ্ভুত প্রান্ত ক্ষেত্রে পূর্বাভাস করতে পারবেন না। এই একটি sysadmin হচ্ছে অংশ ... কিন্তু আপনি আপনার ব্যবসা প্রভাবিত থেকে এটি রাখতে পুনরুদ্ধার পদ্ধতিতে কাজ করতে পারেন। এখনই ঠিক করার চেষ্টা করার একমাত্র উপায় হল অন্য হার্ডওয়্যার কার্ডটি (সম্ভবত আপনি যা করতে চান তা) চেষ্টা করুন বা SATA এর পরিবর্তে SASA এর পরিবর্তে আপনার ড্রাইভগুলি পরিবর্তন করুন কিনা তা দেখতে SAS আরও শক্তিশালী। আপনি RAID কার্ডের আপনার বিক্রেতা সাথে যোগাযোগ করতে পারেন এবং কী ঘটেছে তা তাদের বলুন এবং তারা কী বলে তা দেখতে পারেন; তারা, সব পরে, একটি কোম্পানি যে জেতার ড্রাইভ ইলেকট্রনিক্স এর ins এবং outs বুদ্ধিমান বিশেষজ্ঞ হিসাবে অনুমিত হয়। ড্রাইভগুলি কীভাবে নির্ভরযোগ্যতা এবং বিশ্বস্ততা সম্পর্কে তাদের কাছে আরো প্রযুক্তিগত পরামর্শ থাকতে পারে ... যদি আপনি সঠিক ব্যক্তিদের সাথে কথা বলতে পারেন।

আপনি কিছু মিস করেছেন? আপনি যদি ড্রাইভটির প্রান্ত-কেস ব্যর্থতা যাচাই করতে চান তবে এটি অ্যারে থেকে টেনে আনুন। অ্যারে হ্রাস করা হবে তবে আপনার অদ্ভুত মন্থর এবং ত্রুটিগুলি (ডিগ্রীযুক্ত অ্যারের স্থিতি থেকে পৃথক) থাকা উচিত নয়। আপনি এখন বলছেন যে এটি ঠিক কাজ করছে বলে মনে হচ্ছে, তবে যদি ডিস্কটি ত্রুটি পড়তে থাকে তবে আপনার ড্রাইভটি প্রতিস্থাপন করা উচিত। উচ্চ ক্ষমতা সহ ড্রাইভগুলি মাঝে মাঝে URE ত্রুটি (সেরা কারণ RAID 5, পার্শ্ব নোট চালাতে না পারে) যা অন্য ড্রাইভটি ব্যর্থ না হওয়া পর্যন্ত দেখানো হয় না। এবং যদি আপনি সেই ড্রাইভ থেকে প্রান্ত-কেস আচরণের সম্মুখীন হন তবে আপনি অ্যারের অন্যান্য ড্রাইভে স্থানান্তরিত দূষিত ডেটা চাইবেন না।


17
2017-11-16 11:58



হ্যাঁ ... আমরা ইতিমধ্যে একটি নতুন প্রতিস্থাপন নীতিতে রেখেছি "যদি পড়ার ত্রুটিগুলি উচ্ছ্বসিত হয় তবে এটি yank"। এখন আমি এটি সম্পর্কে চিন্তা করি, আমরা এই ড্রাইভে ব্যর্থতা মোটামুটি উচ্চ হার ছিল। ২4 মাসে ২4 মাসে 4২। হুম .... - Stu Thompson
18 মাসে 18 টি ড্রাইভ? এটি একটি হার যেখানে আছে ... যদিও এটি ড্রাইভে স্পেস নাও থাকতে পারে তবে এটি দেখতে একটি শীতল / বায়ুপ্রবাহ সমস্যাও হতে পারে। অথবা সম্ভবত নিয়ামক সঙ্গে কিছু অদ্ভুত। শুধু কিছু চিন্তা ... লগ উপর নজর রাখুন। আপনি যদি কার্ডগুলিতে প্রকৃত কাজের সাথে 3Ware এ কোনও ব্যক্তির সাথে যোগাযোগ করতে সক্ষম হন তবে শুধুমাত্র একটি স্ক্রিপ্ট নয়, তবে আপনি এটির দ্বারা এটি চালাতে এবং তারা কী বলে তা দেখতে চাইতে পারেন। - Bart Silverstrim
আপনি যে ত্রুটিগুলি দেখছেন সেটটির উপর নির্ভর করে, আপনি এটিও চেক করতে পারেন যে তারের সাথে কিছুটা জঘন্য বা প্রান্তিকও নেই। যদি ত্রুটিগুলি একই পোর্টে ঘনীভূত হয় বলে মনে হয় তবে আপনার ব্যর্থতাগুলির একটি কম সংকেত সেটের কম হতে পারে। - Bart Silverstrim
আমি দেখেছি যে এই বাম ড্রাইভের SMART মানটি ~ 31 ডিগ্রি সেলসিয়াসে চলছে, অথবা অন্যান্য সমস্ত ড্রাইভের চেয়ে 4 ডিগ্রি সেলসিয়াস বেশি। যে জিনিসগুলি আপনাকে হিম্মম করে তোলে .... - Stu Thompson
@ ড্যান্নিলি: 14 টি ড্রাইভের মধ্যে (11 টি ডাটা, 3 টি সিস্টেম) এটি উচ্চ তাপমাত্রা সহ একমাত্র ছিল। আমি মোটামুটি নিশ্চিত যে বায়ুপ্রবাহ ভাল ছিল, কিন্তু আগামীকাল স্পষ্টভাবে চেক করা হবে। - Stu Thompson


আমি একজন বিশেষজ্ঞ নই, তবে আমি RAID কন্ট্রোলার এবং স্টোরেজ অ্যারের সাথে আমার অভিজ্ঞতার ভিত্তিতে অন্ধকারে একটি বন্য শট নিতে যাচ্ছি।

ডিস্ক অনেক বিভিন্ন উপায়ে ব্যর্থ। দুর্ভাগ্যবশত, ডিস্কগুলি ব্যর্থ হতে পারে, অথবা ত্রুটিযুক্ত হতে পারে, তাদের কর্মক্ষমতাগুলি গুরুতরভাবে প্রভাবিত হয় তবে RAID নিয়ামক ব্যর্থতার রূপে দেখেন না।

একটি ডিস্ক একটি সুস্পষ্ট ভাবে ব্যর্থ হলে, কোনও RAID নিয়ামক সফ্টওয়্যার ডিস্ক থেকে প্রতিক্রিয়া অভাব সনাক্ত করা, পুল থেকে এটি অপসারণ করা এবং কোন বিজ্ঞপ্তিগুলি ফায়ারিং করা উচিত। যাইহোক, আমার এখানে অনুমান করা হচ্ছে যে ডিস্কটি একটি অস্বাভাবিক ব্যর্থতা ভোগ করছে যা কিছু কারণে নিয়ামক পক্ষে ব্যর্থতা সৃষ্টি করে না। অতএব নিয়ামক যখন একটি প্রভাব ফ্লাশ বা প্রভাবিত ডিস্ক থেকে একটি পঠন পরিচালনা করে, তখন ফিরে আসতে দীর্ঘ সময় লাগে এবং এর ফলে পুরো আইও অপারেটিং এবং অতএব অ্যারে ঝুলন্ত হয়। যাই হোক না কেন, RAID কন্ট্রোলারের জন্য এটি "অহ, ব্যর্থ ডিস্ক" যেতে যথেষ্ট নয়, সম্ভবত ডেটা শেষ পর্যন্ত ফিরে আসছে।

আমার পরামর্শ অবিলম্বে ব্যর্থ ডিস্ক প্রতিস্থাপন করা হবে। তারপরে, আমি আপনার RAID কার্ডের জন্য কনফিগারেশনটি দেখতে চাই (এটি 3ware, আমি ভেবেছিলাম তারা বেশ ভাল ছিল) এবং এটি কোনও ব্যর্থ ডিস্কটিকে কী বলে মনে করে তা খুঁজে বের করুন।

পুনশ্চ চমৎকার ধারণা Cacti মধ্যে SMART আমদানি।


10
2017-11-16 11:57



একবার আমি বিন্দু সংযুক্ত, প্রথম চিন্তা আমি অ্যারের থেকে ডিস্ক মুছে ফেলার ছিল; গরম অতিরিক্ত ভরাট। যে গত রাতে ছিল। আজ আমি ডিস্ক টানা এবং এটি RMA'd। আপত্তিজনক ড্রাইভ: geekomatic.ch/images/wd-re4-flux-read-error.jpg - Stu Thompson
আমার মনে হয় যে প্রতিটি মিশন সমালোচনামূলক সিস্টেমে এমন একটি কার্ড থাকা দরকার যা ডেটা স্ক্রাবিং করে। আমি গণনা করার জন্য এটি অনেক বার দেখেছি, বিশেষ করে SATA অ্যারেগুলিতে, তবে এমনকি উচ্চতর SAS ডিস্কগুলি কন্ট্রোলারকে ট্রিগার ছাড়াই ব্যর্থ হওয়ার জন্য পরিচিত হয়েছে। - Jens Ehrich


আপনি এন্টারপ্রাইজ ক্লাস স্টোরেজ ডিভাইসের বৈশিষ্ট্য প্রয়োজন। বিশেষত, WD RE 4 এন্টারপ্রাইজ ড্রাইভগুলিতে RAID এ্যারেগুলিতে এই আচরণ প্রতিরোধ করার জন্য প্রয়োজনীয় দুটি বৈশিষ্ট্য রয়েছে। নীচের তালিকাভুক্ত প্রথম প্রযুক্তি হার্ড ড্রাইভ যান্ত্রিক উপাদানগুলিতে অযৌক্তিক পরিধান ঘটাতে ঘূর্ণমান harmonic কম্পন প্রতিরোধ করে। দ্বিতীয় প্রযুক্তি আপনার সমস্যার কারণ কি, SATA প্রোটোকল এই বৈশিষ্ট্য নেই। এই বৈশিষ্ট্যগুলি পেতে আপনার SAS প্রয়োজন, এবং আপনি যদি SATA ড্রাইভে জোর দেন তবে আপনি SASA ইন্টারপোজার কার্ড যেমন LSISS9252 তে কিনতে পারেন।

উন্নত RAFF প্রযুক্তি অত্যাধুনিক ইলেকট্রনিক্স ড্রাইভ মনিটর এবং বাস্তব সময়ে উভয় রৈখিক এবং ঘূর্ণমান কম্পন সঠিক। ফলাফল ড্রাইভ পূর্ববর্তী প্রজন্মের উপর উচ্চ কম্পন পরিবেশে একটি উল্লেখযোগ্য কর্মক্ষমতা উন্নতি।

RAID- নির্দিষ্ট, সময়-সীমাবদ্ধ ত্রুটি পুনরুদ্ধার (TLER) ডেস্কটপ ড্রাইভে প্রচলিত হার্ড ড্রাইভ ত্রুটি-পুনরুদ্ধার প্রক্রিয়াগুলির কারণে সৃষ্ট ড্রাইভ পতনকে আটকায়।

http://en.wikipedia.org/wiki/Error_recovery_control#Overview

এছাড়াও নীচের লিঙ্ক দেখুন দয়া করে:

http://en.wikipedia.org/wiki/Error_recovery_control#Raid_Controllers

এছাড়াও দেখুন: ওয়েস্টার্ন ডিজিটাল টিএলইআর ডকুমেন্ট গভীরতার মধ্যে ত্রুটি পুনরুদ্ধারের প্রক্রিয়া ব্যাখ্যা করছে। WD ক্যাভিয়ার RAID সংস্করণে ত্রুটি পুনরুদ্ধারের পতন প্রতিরোধের সিরিয়াল এটিএ হার্ড ড্রাইভ:

http://www.3dfxzone.it/public/files/2579-001098.pdf


7
2018-02-25 19:34





শুধু একটি অনুমান: হার্ডডিস্কগুলি ত্রুটি ত্রুটির পরিবর্তে পঠিত ত্রুটিগুলিতে পুনরায় চেষ্টা করার জন্য কনফিগার করা হয়েছে। যদিও এটি একটি ডেস্কটপ সেটিংে আকাঙ্ক্ষিত আচরণ, এটি একটি RAID এর বিপরীত (যেখানে নিয়ামকটি যে কোনও সেক্টরের পুনর্লিখন করা উচিত যা অন্য ডিস্ক থেকে পড়তে ব্যর্থ হয়, তাই ড্রাইভ এটি পুনরায় সেট করতে পারে)।


6
2017-11-16 13:30



খুব সম্ভব। যদি তাই হয়, এটি defiantly শান্ত নয় কারণ এটি "RAID সংস্করণ" ইউনিট হিসাবে spec'd হয়। : | - Stu Thompson
একেবারে শান্ত না, কারণ সেটিংটি "RAID সংস্করণ" এর খুব সংজ্ঞা। :) - Simon Richter


অন্ধকার আমার শট:

  • ড্রাইভ 7 ব্যর্থ হয়। এটা কিছু ফাংশন উইন্ডো আছে যেখানে এটি পাওয়া যায় না।

  • ড্রাইভ 8 কিছু 'লাইটার' ত্রুটি আছে; পুনরায় চেষ্টা দ্বারা সংশোধন করা হয়েছে।

  • RAID10 সাধারণত "বিভিন্ন RAID1 জোড়াগুলির একটি RAID0" হয়, একই pair এর 7 এবং 8 ড্রাইভ ড্রাইভ হয়?

যদি তাই হয়, তাহলে মনে হয় আপনি একই জোড়ার দুটি-ডিস্ক ব্যর্থতার ক্ষেত্রে "ঘটতে না" আঘাত করবেন। RAID10 মারতে পারে প্রায় একমাত্র জিনিস। দুর্ভাগ্যবশত, যদি আপনার সমস্ত ড্রাইভগুলি একই শিপিংয়ের থেকে থাকে তবে এটি একই রকম হতে পারে।

আমি মনে করি যে একটি ড্রাইভ 7 ব্যর্থতার সময়, নিয়ামকটি 8 টি ড্রাইভের সমস্ত পাঠ্যকে পুনঃনির্দেশিত করে, তাই কোনও ত্রুটির পুনরাবৃত্তি হ'ল বড় বিলম্বের কারণ যা হিমায়িত কর্মগুলির একটি তুষারপাত সৃষ্টি করে এবং কিছুক্ষণের জন্য কার্য সম্পাদন করে।

আপনি ভাগ্যবান যে ড্রাইভ 8 এখনও মৃত বলে মনে হচ্ছে না, তাই আপনি dataloss ছাড়া ঠিক করতে সক্ষম হওয়া উচিত।

আমি উভয় ড্রাইভ পরিবর্তন করে শুরু করতে চাই, এবং ক্যাবলিং চেক করতে ভুলবেন না। একটি আলগা সংযোগ এটি হতে পারে, এবং দৃঢ়ভাবে রুট না হলে, এটি নিকটবর্তী ড্রাইভে ঘটতে পারে। এছাড়াও, কিছু মাল্টিপোর্ট কার্ডে দুটি দ্বি-পোর্ট সংযোজক রয়েছে, যদি ড্রাইভ 7 এবং ড্রাইভ 8 একই রকম থাকে তবে এটি আপনার সমস্যার উৎস হতে পারে।


6
2017-11-16 14:11



ড্রাইভ 8 পরিষেবাটি বাধা দেওয়ার কারণ কী, আমি ইতিমধ্যে এটি টানা করেছি। ড্রাইভ 7, যখন কিছু কিছু সেক্টর হারিয়ে গেছে, যেমনটি এই অবস্থায় ছিল এবং এখনও এটি ভালভাবে চলছে। না, তারা ড্রাইভ বিভিন্ন জোড়া হয়। (আমার ক্যাকটি / এসএনএমপি প্রশ্নের একটি সম্ভাব্য ভুল সংকেত সহ আমি কিছু বিবেচনা করলাম।)  কার্ডটিতে 16 পোর্ট, 4 টি তারের, 4 টি পোর্ট রয়েছে, যা পিছনে প্যানেলে রয়েছে। সমস্যাটি যদি কার্ড 8, এর প্রতিস্থাপন সন্নিবেশ করানো হয় তবে কার্ড, তারের বা ব্যাকপেনটি আমি শীঘ্রই জানতে পারি। - Stu Thompson


SATA Interposer কার্ড অন্য সমাধান।

আমি সম্প্রতি একই ভাগ্য exacly অভিজ্ঞতা এবং এই থ্রেড খুঁজে পাওয়া যায় নি। সামগ্রিক মেয়াদ এসএএস হয় প্রোটোকল SATA এর তুলনায় RAID এর জন্য উপযুক্ত, কারণ SATA বৈশিষ্ট্যগুলির অভাব রয়েছে। এজন্য একই শারীরিক ড্রাইভগুলি এসএএস নিয়ামকগুলির সাথে সজ্জিত, তারপরে নিরপেক্ষ SAS হিসাবে বিক্রি করা হয়।

আরও অনুসন্ধান, আমি পাওয়া যায়:

http://www.lsi.com/products/storagecomponents/Pages/LSISS9252.aspx

আমি এই একটি ব্যাচ সঙ্গে আমার storages এক আপগ্রেড তদন্ত করছি। এই মুহূর্তে, এসএএস-এর বিপরীতে 3 টিবি সাটা এর দামের দাম 400% (ভ্যানিলা দাম, একই ব্র্যান্ড, চশমা এবং দোকান, জার্মানি)। আমি সম্ভবত এই কৌশল ভাল কাজ করে যদি বলতে পারেন না, কিন্তু এটি একটি চেষ্টা মূল্য।

মন্তব্য খুব স্বাগতম :-)


3
2018-02-22 19:12



ভাল চমৎকার তত্ত্ব। কিছু তথ্য সংগ্রহের পরে, কেবল স্টোরেজ ট্রে নির্মাতারা এই বোর্ডগুলিকে সংহত করতে পারে এবং তাদের যুক্ত করার অর্থ অপরিহার্যভাবে ত্রুটিযুক্ত হ্যান্ডলিংয়ের অর্থ নয়। - korkman


আমি ভাঙা ইলেকট্রনিক্সগুলির সাথে একটি SATA ডিস্ক দেখেছি একটি দৃঢ় ইলেকট্রনিক্সের ফার্মওয়্যার init locked 12 কিছুটা দৃঢ়ভাবে, বাইওস অ্যাক্সেস করার কোন উপায় ছিল না, যন্ত্রটিকে কোনও মাধ্যম থেকে বুট করার অনুমতি না দেওয়া পর্যন্ত বাইনারি থেকে ডিস্কগুলি টেনে আনতে আপত্তিজনক হার্ড ড্রাইভ পাওয়া যায়। অনুসন্ধান ফ্যাশন।


2
2018-05-06 18:57