Anonim

Začalo sa to v sobotu večer, keď sa moja manželka pýtala, prečo náš rekordér náhle prestal hrať šou, ktorú sledovala. Povedal som jej, že to bola pravdepodobne len nejaká závada, ale pozrel by som sa. Chodil som do rodinnej izby, aby som sa pozrel, a chyba v podstate uviedla, že základný disk už nie je k dispozícii. Nie dobré! Toto bol začiatok môjho trojdňového hororového príbehu …

Trochu pozadia

Moje DVR je vlastne iba špecializovaný softvér (SageTV pre tých, čo sú zvedaví), ktorý beží na počítači. Tento softvér je veľmi flexibilný a umožňuje vám oddeliť všetky jeho rôzne aspekty. Mám samostatný stroj na centralizované riadenie, plánovanie a nahrávanie, samostatné stroje na prehrávanie a hviezdu tohto príbehu, samostatný stroj na ukladanie. Na ukladanie používam súborový server Linux, využívajúci LVM (Logical Volume Manager) na agregáciu mnohých samostatných, neidentických jednotiek do jednej veľkej (v súčasnosti ~ 6TB) logickej jednotky, ktorú vidí operačný systém. Keďže zálohovanie viacerých dát TB je nepraktické a keďže uvedené údaje sú „iba“ televíznymi programami, mojou filozofiou zálohovania pre toto bolo vždy to, aby sa nestarali. Až do nedávnych udalostí nebola táto filozofia testovaná skutočnou udalosťou.

Pokúšam sa obnoviť údaje

Keď vidím chybu na DVR, okamžite sa začnem pozerať na úložný server. Systém súborov je neuveriteľne pomalý a pomaly reaguje, takže sa pýtam LVM na stav fyzických jednotiek, ktoré sú základom jeho logického zväzku. Po dlhom oneskorení sa objaví a hovorí, že chýba 750 GB disk. Uh Oh! Reštartujem server a úžasne sa jednotka vráti. Vydám príkaz pvmove na automatickú migráciu všetkých údajov z tohto disku, ale zlyhá pri dokončení menej ako 2%.

Tvárou v tvár disku, ktorý veľmi nespolupracuje pri načítaní jeho údajov, ale aspoň sa objaví v systéme BIOS, sa obraciam na svoj obľúbený nástroj na obnovenie disku Spinrite. Aj keď sa Spinrite bežne spúšťa z vymeniteľného média, pred rokmi som v mojom dome nastavil sieťové zavádzanie pre rôzne nástroje, takže som sa nemusel starať o sledovanie akýchkoľvek médií. Normálne sa pripájam k sieti, vyberiem boot zo siete a mám k dispozícii množstvo nástrojov na vyriešenie mnohých problémov. Problém je v stroji, ktorý robí túto magickú prácu rovnakým strojom, ktorý je v súčasnosti mimo prevádzky. Nemusím hovoriť, že budem zavádzať z disku Spinrite. Až na pár rokov sa optická jednotka na mojom súborovom serveri vzdala ducha. V čase, keď sa to stalo, som sa rozhodol, že v tomto stroji nikdy nepoužívam optické médiá, takže som ho nemusel vymeniť. Nebojte sa, povedal som si, len optickú jednotku vyberiem z môjho hlavného počítača. Vypnem hlavný počítač a vyberte optickú jednotku. Potom vyhľadám svoje bootovacie CD Spinrite. Nemôžem to nájsť! Pred niekoľkými mesiacmi sme sa presťahovali do nového domu, takže je všetko v nepokoje. Myslím, že len spálim novú kópiu, ale nemôžem nájsť ani žiadne prázdne optické médium! Podľa nasledujúceho plánu, zavádzacia jednotka Flash! Po pár minútach na stránkach Google, aby som obnovil svoju pamäť, mám zavádzaciu jednotku Spinrite flash. Spustím z tohto Linuxový box a spustím Spinrite. Počítač zamrzne a zdá sa, že zlyhá. V snahe eliminovať premenné presúvam zlý disk zo zapojeného do rozširujúcej karty PCI-e do priameho zapojenia do základnej dosky. Teraz sa program Spinrite spúšťa v poriadku, ale vymenovanie jednotiek k nemu trvá starnutím a starnutím. Systematicky odpojujem všetky ostatné jednotky okrem tých zlých, ale nikdy to nedokončí výpočet jednotiek bez ohľadu na to, ako dlho budem čakať. Na ďalší plán! Vyberiem disk z môjho systému Linux, pripojím ho k môjmu hlavnému počítaču a naštartujem z môjho nového lesklého disku Spinrite. Spinrite sa spustí a okamžite uvidí disk a poviem mu, aby začal obnovovať údaje, spokojný s tým, že konečne robím určitý pokrok. Vrátim sa, aby som to skontroloval asi po 10 minútach a na obrazovke sa vyskytla chyba a zdá sa, že disk opäť zmizol. Frustrovaný, skúsim to niekoľkokrát a poviem Spinritemu, aby začal v rôznych častiach disku, ale vždy dosiahol rovnaký výsledok. Zdá sa, že mi to nakoniec nepomôže.

V záchvate iracionálnej nádeje som dal disk späť do môjho systému Linux a zapol ho. K môjmu úžasu sa pohon objaví a LVM prináša všetko aktívne. Po ďalšom pokuse o šťastie vydám ďalší príkaz pvmove, aby som sa pokúsil znova presunúť údaje z jednotky. Čoskoro vidím chybové hlásenia o tom, že nie je možné prečítať z jednotky, ale úžasne, pvmove pokračuje v postupe, priblíženie sa a priblíženie sa k 100% dokončenému. Zmes zmätku, úľavy a vzrušenia nado mnou prechádza. Chystám sa dostať z toho bez úhony? Je smutné, že poslednou vecou, ​​ktorú LVM robí pod krytom, aby čisto dokončil pvmove, je napísať aktualizovaný protokol do všetkých jednotiek, ktoré sú pod jeho kontrolou. Toto samozrejme zlyhá, keď sa pokúša zapísať na zlú jednotku, a tým celý proces preruší. Porážka opäť vytrhla z čeľustí víťazstva! Ponorím sa späť do spoločnosti Google a zistím, že je možné ovládať, koľko údajov sa príkaz pvmove pohne namiesto presunutia VŠETKÝCH údajov do jedného záberu. Experimentujem s tým a mám dobrý úspech pri pohybe malej časti mojich údajov súčasne. Mám chamtivosť a disk niekoľkokrát zmizne, ale vždy sa vracia po cykle napájania počítača. Teoreticky sa domnievam, že možno sú zlé iba určité časti jednotky, ale namiesto toho, aby som začal pracovať na začiatku jednotky, začnem skákať. Po niekoľkých opakovaniach som z jednotky bezpečne odišiel 40 GB zo 750 GB. Zostávajúcich 40 GB sa nedokázalo pohnúť bez ohľadu na to, čo som vyskúšal. Bola dnes nedeľa večer a bol som vyčerpaný, takže som sa rozhodol ísť druhý deň spať a riešiť tento problém.

Nasledujúci deň, po nejakom spánku a prvej polovici dňa v práci, sa rozhodnem zahryznúť guľku, pretože ma nezaujímalo posledných 40 GB nahratých televíznych relácií a rozhodol som sa odstrániť disk z mojej konfigurácie LVM, Urobil som to už mnohokrát, takže to ide celkom hladko. Ďalej v zozname vyčistení je oprava otvoru v strede súborového systému. Myslím, že chýba iba 40 GB namiesto 750 GB, nemôže to byť príliš zlé, však? Zle! Po oprave som mal o 900 GB viac voľného miesta v porovnaní s pred začiatkom utrpenia, takže som to trochu zabodol. No dobre, hovorím si, vlastne to bola len televízia. Môj DVR je konečne funkčný znova po trojdňovom prestávke a konečne o tom môžem premýšľať pri každom ďalšom mozgovom cykle.

Ponaučenie

Čo som sa z toho všetkého naučil? Mal som urobiť lepšiu prácu v tom, na čom skutočne záleží. Stalo sa to pred niekoľkými týždňami a za tú dobu mi ani nevynechal žiadny zmiznutý televízny obsah. Ľutujem však, že bráni sebe, ale čo je dôležitejšie, mojej rodine, aby mohla používať televízor tri dni a že som sa na tieto tri dni dostala do krízového režimu s vysokým stresom. Keby som sa na začiatku vzdal obnovy svojich údajov, funkcia by sa obnovila asi za hodinu, nie za tri dni. Veľmi dobre viem, že väčšinu času sú naše údaje cenné, ale v tejto situácii to tak nebolo.

Po druhé, ak sú vaše údaje skutočne drahé a 99% času v skutočnosti sú, musíte ich chrániť! Zálohujte svoje dáta, neexistujú žiadne ospravedlnenia. Pokiaľ ide o moje nenahraditeľné údaje, napríklad tisíce obrázkov môjho syna, ktoré mám vo svojom počítači, nezabudnite ich zálohovať na najmenej troch miestach, z ktorých jedným je poskytovateľ cloudového zálohovania. Pokiaľ ide o úložisko DVR, stále si nemyslím, že je praktické zálohovať ho do cloudu, ale s cenou pohonných jednotiek dnes nemám nijaké ospravedlnenie, že ho nechcem chrániť pomocou RAID, a to je presne to, čo som urobím. Keď som prvýkrát vytvoril svoj úložný klaster pred rokmi, myslím, že mi trvalo desať a viac diskov, aby som sa dostal k skupine viacerých TB. Práve som skontroloval ceny a môžete si kúpiť disk 3 TB hneď za 100 dolárov. Jednoducho nemám žiadne ospravedlnenie za to, že moje údaje nechránim, a ak sa mi takto stane opakovaná strata údajov, je to skutočne moja vina.

Príbeh smútku, frustrácie a straty údajov