[OT-Frage] Sicherer Speicher fÃÂ¼r wichtige Daten...

Peter Heirich · Nov 5, 2022

Gerrit Heitsch wrote:

Noch schÃ¶ner ist, daÃ die zweite HD schon defekt sein kann, es aber
bisher noch
nicht aufgefallen ist weil der defekte Bereich schon lÃ¤nger nicht mehr
gelesen
wurde. Beim Resync wird aber alles gelesen und dann fÃ¤llt es auf.

M.E. eher unwahrscheinlich. In einem ordentlich designten Sytem sollte
minimal 1x die Woche der Virenscanner alles mal prÃ¼fen.

Peter

Volker Bartheld · Nov 5, 2022

Gerrit Heitsch wrote:
Noch schöner ist, daß die zweite HD schon defekt sein kann, es aber
bisher noch nicht aufgefallen ist weil der defekte Bereich schon
länger nicht mehr gelesen wurde. Beim Resync wird aber alles gelesen
und dann fällt es auf.

On Sat, 5 Nov 2022 00:01:47 -0000 (UTC), Peter Heirich wrote:

M.E. eher unwahrscheinlich. In einem ordentlich designten Sytem sollte
minimal 1x die Woche der Virenscanner alles mal prüfen.

Warum? Welche Relevanz hätte die Existenz von Virensignaturen z. B. auf
einem NAS, das Dateien zwar schreibt und liest, aber nie ausführt? Ich
würde mich außerdem schönstens bedanken, wenn irgendein \"ordentlich
designtes System\" 1x/Woche meine 4TB an Mediendaten durchschrabbelt.

Und selbst wenn das passierte: Bist Du sicher, daß z. B. in einer
RAID-1-Architektur tatsächlich beide Kopien gelesen werden und nicht
etwa nur die, die grad am opportunsten ist?

\"Zur Erhöhung der Sicherheit kann ein RAID-1-System beim Lesen stets auf
mehr als eine Festplatte zugreifen. Dabei werden die Antwortdatenströme
der Festplatten verglichen. Bei Unstimmigkeiten wird eine Fehlermeldung
ausgegeben, da die Spiegelung nicht länger besteht. Diese Funktion
bieten nur wenige Controller an, auch reduziert sie die Geschwindigkeit
des Systems geringfügig.\" [1]

liest sich nicht so, als sei das ein Feature, auf das man sich verlassen
könnte.

Volker

[1] https://de.wikipedia.org/wiki/RAID#RAID_1:_Mirroring_%E2%80%93_Spiegelung

Rolf Bombach · Nov 5, 2022

Helmut Schellong schrieb:

Man stelle sich vor, 10 Millionen Festplatten werden mit sehr hoher Wahrscheinlichkeit
innerhalb des kommenden halben Jahres defekt gehen.
Ein halbes Jahr hat etwa 15 Millionen Sekunden.
Es kann gut sein, daÃ dabei gar keine >1 Festplatten in derselben Sekunde defekt gehen.

Die Platten gehen aber unabhÃ¤ngig voneinander spontan kaputt.

Es gibt zwei GrenzfÃ¤lle:
- Eine Uhr tickt ein mal pro Sekunde.
- Ein GeigerzÃ¤hler tickt ein mal pro Sekunde.

Wir sind nahe an Grenzfall 2. Also Stochastik. Die sagt,
dass die Wahrscheinlichkeit eines Plattenausfalls am
grÃ¶ssten ist unmittelbar nach einem andern Plattenausfall.
Danach nimmt sie exponentiell ab.
Wahrscheinlich werden zumindest phasenweiseÂ¹ mehr Platten
innerhalb einer Sekunde kaputt gehen als ausserhalb.
Ja, psychologisch ist das schwer fassbar, aber leicht
statistisch erfassbar.

Â¹Sobald sehr viele weg sind, werden natÃ¼rlich immer weniger
kaputt gehen.

> Wie verhÃ¤lt sich das, wenn nur 2 statt 10000000 Festplatten betrachtet werden?

Dann passiert das seltener.

Es gibt hier eine Ãhnlichkeit zu dem Spiel, wo Kugeln vertikal durch ein Feld aus NÃ¤geln
und abschlieÃend in Aufbewahrungs-RÃ¶hren fallen.

Damit hat das exakt gar nichts zu tun.

--
mfg Rolf Bombach

Helmut Schellong · Nov 5, 2022

On 11/04/2022 22:16, Sieghard Schicktanz wrote:

Hallo Helmut,

Du schriebst am Fri, 4 Nov 2022 15:32:18 +0100:

Man stelle sich vor, 10 Millionen Festplatten werden mit sehr hoher
Wahrscheinlichkeit innerhalb des kommenden halben Jahres defekt gehen.
Ein halbes Jahr hat etwa 15 Millionen Sekunden.
Es kann gut sein, daß dabei gar keine >1 Festplatten in derselben
Sekunde defekt gehen.

Wie verhält sich das, wenn nur 2 statt 10000000 Festplatten
betrachtet werden?

Das verhält sich halt so, daß Statistik recht zufällig individuelle
Ergebnisse liefert.

Es geht um Wahrscheinlichkeiten und Wahrscheinlichkeitsrechnung.

Die Wahrscheinlichkeit sinkt (auf den ersten Blick) auf ein 5000000-stel
der ersten Wahrscheinlichkeit: w2 = w1 / (10000000/2)

(Die mathematische Darstellung einer Wahrscheinlichkeit ist hier undefiniert.)

--
Mit freundlichen Grüßen
Helmut Schellong var@schellong.biz
http://www.schellong.de/c.htm http://www.schellong.de/c2x.htm http://www.schellong.de/c_padding_bits.htm
http://www.schellong.de/htm/bishmnk.htm http://www.schellong.de/htm/rpar.bish.html http://www.schellong.de/htm/sieger.bish.html
http://www.schellong.de/htm/audio_proj.htm http://www.schellong.de/htm/audio_unsinn.htm http://www.schellong.de/htm/tuner.htm
http://www.schellong.de/htm/string.htm http://www.schellong.de/htm/string.c.html http://www.schellong.de/htm/deutsche_bahn.htm
http://www.schellong.de/htm/schaltungen.htm http://www.schellong.de/htm/math87.htm http://www.schellong.de/htm/dragon.c.html

Rolf Bombach · Nov 5, 2022

Helmut Schellong schrieb:

Ich beachte _nur_ eigene konkrete Erfahrungen und _solche_ aus meinem Umfeld.
Betreffend Festplatten und PC-Netzteile.

Diese sagen mir ganz klar, daÃ es extrem unwahrscheinlich ist, daÃ zwei Festplatten
zum gleichen Zeitpunkt defekt gehen und sofort keinen Datenverkehr mehr zulassen.

Kommt doch auf den Ausfallmechanismus an. Jede Platte fÃ¼r sich, ja.
Allerdings gibt es auch gemeinsame Ursachen: Netzteil explodiert (BDTD),
Decke stÃ¼rzt auf PC, Blitzschlag, Brand, Hochwasser (etwa 4 PCs hab
ich bei FeuerwehreinsÃ¤tzen aus dem Wasser gezogen).

Ich verwende seit Jahrzehnten ausnahmslos Festplatten WD Gold Enterprise 24/7.
IBM produziert seit Jahrzehnten keine mehr - und ist damit irrelevant.

Die Kurven wurden hier gezeigt; fast alle Hersteller hatten
ihre HÃ¶hen und Tiefen. So schlecht wie WDC im Sommer 18 war
eigentlich kein anderer Hersteller. IBM ist jetzt wohl HGST,
die haben eigentlich sehr tiefe Ausfallraten.

--
mfg Rolf Bombach

Michael Schwingen · Nov 5, 2022

On 2022-11-05, Rolf Bombach <rolfnospambombach@invalid.invalid> wrote:

Diese sagen mir ganz klar, daÃ es extrem unwahrscheinlich ist, daÃ zwei Festplatten
zum gleichen Zeitpunkt defekt gehen und sofort keinen Datenverkehr mehr zulassen.

Kommt doch auf den Ausfallmechanismus an. Jede Platte fÃ¼r sich, ja.
Allerdings gibt es auch gemeinsame Ursachen: Netzteil explodiert (BDTD),
Decke stÃ¼rzt auf PC, Blitzschlag, Brand, Hochwasser (etwa 4 PCs hab
ich bei FeuerwehreinsÃ¤tzen aus dem Wasser gezogen).

+ Fertigungsfehler und Firmware-Bugs. Es gab da welche, die durchaus zum
Ausfall von 2 Platten kurz nacheinander (oder nach der gleichen Anzahl von
EinschaltvorgÃ¤ngen) fÃ¼hrte, ich habe da mal bei einem RAID aus baugleichen
Seagate-Platten Daten retten dÃ¼rfen.

Seitdem versuche ich, unterschiedliche Platten einzusetzen.

cu
Michael

Helmut Schellong · Nov 5, 2022

On 11/05/2022 11:43, Rolf Bombach wrote:

Helmut Schellong schrieb:

Man stelle sich vor, 10 Millionen Festplatten werden mit sehr hoher Wahrscheinlichkeit
innerhalb des kommenden halben Jahres defekt gehen.
Ein halbes Jahr hat etwa 15 Millionen Sekunden.
Es kann gut sein, daÃ dabei gar keine >1 Festplatten in derselben Sekunde defekt gehen.

Die Platten gehen aber unabhÃ¤ngig voneinander spontan kaputt.

Ja, bei dieser Betrachtung sind die AbhÃ¤ngigkeiten voneinander vernachlÃ¤ssigbar.

Es gibt zwei GrenzfÃ¤lle:
- Eine Uhr tickt ein mal pro Sekunde.
- Ein GeigerzÃ¤hler tickt ein mal pro Sekunde.

Wir sind nahe an Grenzfall 2. Also Stochastik. Die sagt,
dass die Wahrscheinlichkeit eines Plattenausfalls am
grÃ¶ssten ist unmittelbar nach einem andern Plattenausfall.
Danach nimmt sie exponentiell ab.

Ja, entsprechende Punktewolken enthalten fast immer stoÃweise HÃ¤ufungen.

Wahrscheinlich werden zumindest phasenweiseÂ¹ mehr Platten
innerhalb einer Sekunde kaputt gehen als ausserhalb.
Ja, psychologisch ist das schwer fassbar, aber leicht
statistisch erfassbar.

Â¹Sobald sehr viele weg sind, werden natÃ¼rlich immer weniger
kaputt gehen.

Ich hatte mir 1978 einen TI59 mit mehreren Zusatzmodulen gekauft
und mich sehr intensiv damit beschÃ¤ftigt.
Ich bin hinsichtlich der Themen Wahrscheinlichkeitsrechnung, Statistik, Verteilungen,
Lineare Regression, Kombinatorik, etc., ein kleiner Experte.
Psychologie spielt bei meinen solchen Betrachtungen nie eine Rolle.

Wie verhÃ¤lt sich das, wenn nur 2 statt 10000000 Festplatten betrachtet werden?

Dann passiert das seltener.

Ja, sehr sehr sehr sehr sehr sehr viel seltener.
Es geht auch hier um eine Wahrscheinlichkeit.

GegenÃ¼berstellung:

Bei wievielen TestlÃ¤ufen von 1 Million kommt es statistisch vor, daÃ diese jew. beiden
Festplatten innerhalb derselben Sekunde (von 15 Mio. Sek.) kaputt gehen?
HÃ¶chstwahrscheinlich in gar keinem Testlauf dieser 1 Mio. TestlÃ¤ufe!
Es ist auch unwahrscheinlich, daÃ die erste Festplatte in Sekunde x und die
zweite Festplatte in Sekunde x+1 kaputt geht.

Jedoch bei 10 Mio. statt zwei Festplatten ist es wahrscheinlicher, daÃ es nicht wenige
Sekunden gibt, wÃ¤hrend denen jeweils so 2..7 Festplatten kaputt gehen.

Es gibt hier eine Ãhnlichkeit zu dem Spiel, wo Kugeln vertikal durch ein Feld aus NÃ¤geln
und abschlieÃend in Aufbewahrungs-RÃ¶hren fallen.

Damit hat das exakt gar nichts zu tun.

Es geht mir hier von Anfang an immer nur um einen jeweiligen Endzustand, nicht um einen inneren Verlauf.
Und dabei gibt es zweifellos eine Ãhnlichkeit, wie ich schrieb:
Die Anzahl Kugeln entsprechen der Anzahl Festplatten.
Die Anzahl Aufbewahrungs-RÃ¶hren entsprechen der Anzahl Sekunden.

http://www.schellong.de/htm/defekt.htm#zweite

--
Mit freundlichen GrÃ¼Ãen
Helmut Schellong var@schellong.biz
http://www.schellong.de/c.htm http://www.schellong.de/c2x.htm http://www.schellong.de/c_padding_bits.htm
http://www.schellong.de/htm/bishmnk.htm http://www.schellong.de/htm/rpar.bish.html http://www.schellong.de/htm/sieger.bish.html
http://www.schellong.de/htm/audio_proj.htm http://www.schellong.de/htm/audio_unsinn.htm http://www.schellong.de/htm/tuner.htm
http://www.schellong.de/htm/string.htm http://www.schellong.de/htm/string.c.html http://www.schellong.de/htm/deutsche_bahn.htm
http://www.schellong.de/htm/schaltungen.htm http://www.schellong.de/htm/math87.htm http://www.schellong.de/htm/dragon.c.html

Helmut Schellong · Nov 5, 2022

On 11/05/2022 12:53, Rolf Bombach wrote:

Helmut Schellong schrieb:

Ich beachte _nur_ eigene konkrete Erfahrungen und _solche_ aus meinem Umfeld.
Betreffend Festplatten und PC-Netzteile.

Diese sagen mir ganz klar, daÃ es extrem unwahrscheinlich ist, daÃ zwei Festplatten
zum gleichen Zeitpunkt defekt gehen und sofort keinen Datenverkehr mehr zulassen.

Kommt doch auf den Ausfallmechanismus an. Jede Platte fÃ¼r sich, ja.

Genau so meine ich das, und genau so schreibe ich das Ã¼berall.
Ich meine stets meinen Festplatten-Mirror in meinem PC.

> Allerdings gibt es auch gemeinsame Ursachen: Netzteil explodiert (BDTD),

Kenne ich; wurde vor Jahren schon hier besprochen.
Meine eigene Erfahrung zeigte mir bisher _nur_ Spannungen, die fehlerhaft klein waren.
Also z.B. 1,6V statt 12V, und vergleichbar.
Auch 5Vstb war mal plÃ¶tzlich bei 0,8V.

Decke stÃ¼rzt auf PC, Blitzschlag, Brand, Hochwasser (etwa 4 PCs hab
ich bei FeuerwehreinsÃ¤tzen aus dem Wasser gezogen).

Ich kopiere auch in meine Cloud.

Ich verwende seit Jahrzehnten ausnahmslos Festplatten WD Gold Enterprise 24/7.
IBM produziert seit Jahrzehnten keine mehr - und ist damit irrelevant.

Die Kurven wurden hier gezeigt; fast alle Hersteller hatten
ihre HÃ¶hen und Tiefen. So schlecht wie WDC im Sommer 18 war
eigentlich kein anderer Hersteller. IBM ist jetzt wohl HGST,
die haben eigentlich sehr tiefe Ausfallraten.

Es kommt auch darauf an, aus welcher HDD-Familie gekauft wird.

Ich kenne grob die Historie von WDC.
Ganz frÃ¼h, als Conner noch gÃ¤ngig war, war WDC gut.
Dann hatte WDC eine lange kritische Phase.
Danach, bis heute, habe ich keinen Grund zur Klage.
Seagate und WDC sind seit Jahrzehnten fÃ¼hrend.
WDC hat Hitachi-HDD und Sandisk geschluckt.

--
Mit freundlichen GrÃ¼Ãen
Helmut Schellong var@schellong.biz
http://www.schellong.de/c.htm http://www.schellong.de/c2x.htm http://www.schellong.de/c_padding_bits.htm
http://www.schellong.de/htm/bishmnk.htm http://www.schellong.de/htm/rpar.bish.html http://www.schellong.de/htm/sieger.bish.html
http://www.schellong.de/htm/audio_proj.htm http://www.schellong.de/htm/audio_unsinn.htm http://www.schellong.de/htm/tuner.htm
http://www.schellong.de/htm/string.htm http://www.schellong.de/htm/string.c.html http://www.schellong.de/htm/deutsche_bahn.htm
http://www.schellong.de/htm/schaltungen.htm http://www.schellong.de/htm/math87.htm http://www.schellong.de/htm/dragon.c.html

Rolf Bombach · Nov 5, 2022

Michael Schwingen schrieb:

+ Fertigungsfehler und Firmware-Bugs. Es gab da welche, die durchaus zum
Ausfall von 2 Platten kurz nacheinander (oder nach der gleichen Anzahl von
EinschaltvorgÃ¤ngen) fÃ¼hrte, ich habe da mal bei einem RAID aus baugleichen
Seagate-Platten Daten retten dÃ¼rfen.

Seitdem versuche ich, unterschiedliche Platten einzusetzen.

Materialbeschaffer/Bewirtschafter einer Serverfarm dÃ¼rfte
ein Albtraumberuf sein. Aber sicher interessant.

--
mfg Rolf Bombach

Gerrit Heitsch · Nov 5, 2022

On 11/4/22 17:04, Guido Grohmann wrote:

Gerrit Heitsch schrieb:
On 11/4/22 07:33, Guido Grohmann wrote:

Es ist tatsÃ¤chich nie der Fall eingetreten, daÃ 2 HDDs eines RAID1
gleichzeitig kaputtgegangen sind.

Dann hast du GlÃ¼ck gehabt. Ich hatte das und es waren nicht einmal die
erwÃ¤hnten IBM. Da es das Boot-RAID1 war, war danach der komplette
Server offline und man musste erst einmal ein Minimal-OS installieren
bevor man das Backup zurÃ¼ckspielen konnte. War kein schÃ¶ner Tag.

Wenn mir das passiert wÃ¤re, hÃ¤tte ich zwei neue HDDs reingesteckt, die
Kiste von CD gebootet (Linux) und das Windows von einem Imageserver
wieder eingespielt.

Eine neue HD hatte ich... Eine zweite musste erst geliefert werden. Es
war ein Solaris-Server. Backup war vorhanden, aber damit man das
zurÃ¼ckspielen kann braucht man natÃ¼rlich erst einmal ein Minimalsystem.

Die Daten selbst waren auf FCAL angebundenen LUNs.

Gerrit

Gerrit Heitsch · Nov 5, 2022

On 11/5/22 01:01, Peter Heirich wrote:

Gerrit Heitsch wrote:

Noch schÃ¶ner ist, daÃ die zweite HD schon defekt sein kann, es aber
bisher noch
nicht aufgefallen ist weil der defekte Bereich schon lÃ¤nger nicht mehr
gelesen
wurde. Beim Resync wird aber alles gelesen und dann fÃ¤llt es auf.

M.E. eher unwahrscheinlich. In einem ordentlich designten Sytem sollte
minimal 1x die Woche der Virenscanner alles mal prÃ¼fen.

Virenscanner? Wir reden hier von Servern, nicht von Desktopsystemen und
Windows ist da schon gar nicht im Spiel.

Gerrit

Michael Schwingen · Nov 5, 2022

On 2022-11-05, Peter Heirich <talk.usenet@info21.heirich.name> wrote:

M.E. eher unwahrscheinlich. In einem ordentlich designten Sytem sollte
minimal 1x die Woche der Virenscanner alles mal prÃ¼fen.

Virenscanner lesen nicht die ganze Datei ein, sondern nur die Teile, die zur
Untersuchung nÃ¶tig sind.

cu
Michael

Sieghard Schicktanz · Nov 5, 2022

Hallo Volker,

Du schriebst am Sat, 5 Nov 2022 07:48:11 +0100:

ausführt? Ich würde mich außerdem schönstens bedanken, wenn irgendein
\"ordentlich designtes System\" 1x/Woche meine 4TB an Mediendaten
durchschrabbelt.

Wird Dir aber nicht erspart bleiben - wenn auch evtl. mit anderen
Abständen - wenn das Zeugs auf SSDs liegt. Die brauchen \"gelegentlich\"
mal eine Auffrischung, bevor die Fehlerkorrektur die Daten nicht mehr
wiederherstellen kann.

Und selbst wenn das passierte: Bist Du sicher, daß z. B. in einer
RAID-1-Architektur tatsächlich beide Kopien gelesen werden und nicht
etwa nur die, die grad am opportunsten ist?

Nee, da werden schon beide gelesen, wenn der Controller gut ist, und
zwar so ineinander verschachtelt (aka \"interleaved\"), daß die Daten
möglichst schneller komplett gelesen sind, als das eine einzelne Platte
schaffen könnte. (Relativiert sich aber wohl derzeit wegen der SSDs.)

--
(Weitergabe von Adressdaten, Telefonnummern u.ä. ohne Zustimmung
nicht gestattet, ebenso Zusendung von Werbung oder ähnlichem)
-----------------------------------------------------------
Mit freundlichen Grüßen, S. Schicktanz
-----------------------------------------------------------

Peter Heirich · Nov 5, 2022

Volker Bartheld wrote:

Warum? Welche Relevanz hätte die Existenz von Virensignaturen z. B. auf
einem NAS, das Dateien zwar schreibt und liest, aber nie ausführt? Ich
würde mich außerdem schönstens bedanken, wenn irgendein \"ordentlich
designtes System\" 1x/Woche meine 4TB an Mediendaten durchschrabbelt.

Ich war etwas verkürzt.

Es geht nicht darum, das NAS selbst zu schützen.

Deshalb läuft auf meiner QNAP der QNAP-übliche Malware-Remover, der
eigentlich ein Clamav ist.

Sinn ist ein Zeitvorsprung in folgendem Szenario:

Eine nicht erkannte Ransom-ware wird u.a. auf dem NAS abgelegt. Da sie
dort nicht ausgeführt wurde, installiert sie auch nicht ihre \"Tarnkappe\".

Das entspricht etwa der \"Ausschaltung\" von Rootkits durch Boot von einem
frischen, geprüften Datenträger.

Wenn jetzt später diese Ransom-ware irgendwo auffällt und deshalb Eingang
in die Virensignaturen erhält, besteht die Chance, eine Ransom-ware zu
erkennen, bevor diese Totalschaden anrichtet.

Der Trick bei Ransom-ware ist ja, dass ein Rootkit installiert wird, über
längere Zeit die Dateien verschlüsselt und transparent entschlüsselt
werden. Ist das umfassend erledigt, wird der lokale Schlüssel weggeworfen
und man kann, wenn überhaupt, die Backupkopie des Schlüssels \"käuflich
erwerben\".

Aber: Ich hatte schon Sekunden nach dem Post die Erkenntnis, das
notwendige Backup nicht erwähnt zu haben. RAID ersetzt kein Backup, denn
sowohl Verschlüsselung durch Ransom-ware, als auch simples Löschen oder
Üerschreiben durch Viren bis Bedienfehler, werden auf RAID-Systemen
getreulich auf allen Platten ausgeführt.

Schon durch das Backup werden alle Dateien üblicherweise angefasst. Klar,
es gibt incrementelle oder differenzielle Backups, da dehnt sich die Zeit
der Erkennung bis zum Vollbackup.

Ich persönlich habe auf tägliches deduplizierendes Backup ( Borg ) für
Linux umgestellt. Da werden alle Dateien täglich komplett gelesen.

Um aber wieder etwas On-Topic zu werden:

Kennt jemand einen z.B. USB-Stick, der mit interner Elektronik
kryptographische Prüfsummen des Inhalts bildet und diesen Prüfsummenwert
auf Knopfdruck abspeichert. Stimmt die Prüfsumme nicht mehr, soll der
Stick blinken und quitschen, um Aufmerksamkeit zu erzeugen.

Sinn: Honey-pot für Ransom-ware.

Peter

Gerrit Heitsch · Nov 5, 2022

On 11/5/22 22:19, Peter Heirich wrote:

Ich persÃ¶nlich habe auf tÃ¤gliches deduplizierendes Backup ( Borg ) fÃ¼r
Linux umgestellt. Da werden alle Dateien tÃ¤glich komplett gelesen.

Das mÃ¶chte ich bezweifeln. Schon bei einstelligen TB wÃ¼rde es mehr als
24h dauern alle Daten zu lesen. Es gibt dazu auch einen Hinweis:

quick detection of unmodified files

deutet auf den Ã¼blichen Check von Filesize und Modification date hin.
Dazu braucht man die Datei selbst nicht zu lesen.

BTW: Folgendes wÃ¼rde mich von BORG Abstand halten lassen:

A chunk is considered duplicate if its id_hash value is identical.

Wenn der Hash kÃ¼rzer ist als der Chunk ist das zwangslÃ¤ufig nicht 100%
sicher.

Und:

EXPECT THAT WE WILL BREAK COMPATIBILITY REPEATEDLY WHEN MAJOR RELEASE
NUMBER CHANGES (like when going from 0.x.y to 1.0.0 or from 1.x.y to 2.0.0).

Alles von: https://borgbackup.readthedocs.io/en/stable/

Ich bleibe fÃ¼r meine Backups lieber bei rsync, Quelle und Ziel sind
Filesysteme und wenn man will kann man damit versionierte Backups
erstellen die an Timemaschine von MacOS erinnern. Wer wissen will wie
lese nach wie man die Option \'--link-dest=<dir>\' benutzt.

Gerrit

Peter Heirich · Nov 6, 2022

Gerrit Heitsch wrote:

Das mÃ¶chte ich bezweifeln. Schon bei einstelligen TB wÃ¼rde es mehr als
24h dauern alle Daten zu lesen. Es gibt dazu auch einen Hinweis:

quick detection of unmodified files

Gutes Argument, mÃ¶glicherweise ist das sogar so.

DemnÃ¤chst mal im Quellcode lesen und prÃ¼fen ob man das umgehen kann.

Und klar, sind Hash-Kollisionen eine Gefahr.

Ich denke aber, die Gefahr, dass ich selbst getÃ¶tet werde und kein Backup
mehr brauche ist weit hÃ¶her.

Peter

Gerrit Heitsch · Nov 6, 2022

On 11/6/22 01:00, Peter Heirich wrote:

Gerrit Heitsch wrote:

Das mÃ¶chte ich bezweifeln. Schon bei einstelligen TB wÃ¼rde es mehr als
24h dauern alle Daten zu lesen. Es gibt dazu auch einen Hinweis:

quick detection of unmodified files

Gutes Argument, mÃ¶glicherweise ist das sogar so.

DemnÃ¤chst mal im Quellcode lesen und prÃ¼fen ob man das umgehen kann.

Und klar, sind Hash-Kollisionen eine Gefahr.

Ich denke aber, die Gefahr, dass ich selbst getÃ¶tet werde und kein
Backup mehr brauche ist weit hÃ¶her.

Der Teufel ist ein EichhÃ¶rnchen...

Gerrit

Gerrit Heitsch · Nov 6, 2022

On 11/6/22 01:00, Peter Heirich wrote:

Gerrit Heitsch wrote:

Das mÃ¶chte ich bezweifeln. Schon bei einstelligen TB wÃ¼rde es mehr als
24h dauern alle Daten zu lesen. Es gibt dazu auch einen Hinweis:

quick detection of unmodified files

Gutes Argument, mÃ¶glicherweise ist das sogar so.

DemnÃ¤chst mal im Quellcode lesen und prÃ¼fen ob man das umgehen kann.

Bei \'rsync\' kann man es mit der Option \'-c\'. Und ja, es macht einen
gigantischen Unterschied in der fÃ¼r ein Backup benÃ¶tigten Zeit. Es
dauert dann immer gleich lang und zwar im Bereich wie das erste Vollbackup.

Gerrit

Michael Schwingen · Nov 6, 2022

On 2022-11-05, Sieghard Schicktanz <Sieghard.Schicktanz@SchS.de> wrote:

Nee, da werden schon beide gelesen, wenn der Controller gut ist, und
zwar so ineinander verschachtelt (aka \"interleaved\"), daÃ die Daten
mÃ¶glichst schneller komplett gelesen sind, als das eine einzelne Platte
schaffen kÃ¶nnte. (Relativiert sich aber wohl derzeit wegen der SSDs.)

Wieso sollta man die doppelte Datenmenge lesen und dann 50% wegwerfen, wenn
man auf Lesegeschwindigkeit optimieren will?

Will sagen: es wird 50% vom einen und die anderen 50% vom anderen Laufwerk
gelesen (ja, interleaved). Das gibt doppeltes Tempo, aber keinen
100%-Lesetest.

Bei Linux-md-RAID gibt es eine check-Funktion, die periodisch ausgefÃ¼hrt das
tut, was man wirklich braucht (man 4 md):

As storage devices can develop bad blocks at any time it is valuable to
regularly read all blocks on all devices in an array so as to catch
such bad blocks early. This process is called scrubbing.

md arrays can be scrubbed by writing either check or repair to the file
md/sync_action in the sysfs directory for the device.

Requesting a scrub will cause md to read every block on every device in
the array, and check that the data is consistent. For RAID1 and
RAID10, this means checking that the copies are identical. For RAID4,
RAID5, RAID6 this means checking that the parity block is (or blocks
are) correct.

If a read error is detected during this process, the normal read-error
handling causes correct data to be found from other devices and to be
written back to the faulty device. In many case this will effectively
fix the bad block.

Debian macht das per Default 1* im Monat.

Wie man das bei anderen Raid-Systemen macht, bleibt dem Leser als
Rechercheaufgabe Ã¼berlassen.

cu
Michael

Laurenz Trossel · Nov 6, 2022

On 2022-11-05, Rolf Bombach <rolfnospambombach@invalid.invalid> wrote:

Materialbeschaffer/Bewirtschafter einer Serverfarm dÃ¼rfte
ein Albtraumberuf sein. Aber sicher interessant.

https://www.backblaze.com/blog/backblaze-drive-stats-for-q3-2022/

[OT-Frage] Sicherer Speicher fÃÂ¼r wichtige Daten...

Peter Heirich

Guest

Volker Bartheld

Guest

Rolf Bombach

Guest

Helmut Schellong

Guest

Rolf Bombach

Guest

Michael Schwingen

Guest

Helmut Schellong

Guest

Helmut Schellong

Guest

Rolf Bombach

Guest

Gerrit Heitsch

Guest

Gerrit Heitsch

Guest

Michael Schwingen

Guest

Sieghard Schicktanz

Guest

Peter Heirich

Guest

Gerrit Heitsch

Guest

Peter Heirich

Guest

Gerrit Heitsch

Guest

Gerrit Heitsch

Guest

Michael Schwingen

Guest

Laurenz Trossel

Guest

Log in

Welcome to EDABoard.com

Sponsor

[OT-Frage] Sicherer Speicher fÃÂ¼r wichtige Daten...