[gull] Write Amplification on SSD

Cédric cedric.dufour at ced-network.net
Thu Feb 11 13:52:31 CET 2016


Bonjour à tous,

Nouvellement inscrit sur cette liste, j'en suis avec intérêt les échanges!

Concernant:

On 11/02/16 11:39, Daniel Cordey wrote:
> On 11. 02. 16 01:39, Arnaud wrote:
>
> [...]
>
> Ce qui me fait dire que la notion de backup devient de plus en plus
> difficile à réaliser. Il faut commencer à penser autrement.
>

Pour ma part (~2TB de données) - et même au sein de l'entreprise pour
laquelle je travaille (~500TB de données) - nous avons abandonné la
notion de "backup" au sens "archives" (c'est-à-dire conserver de
multiples copies - intégrales, incrémentales ou différentielles - des
données, faites à des moments choisis plus ou moins stratégiquement).

En lieu et place, la stratégie de "sécurité des données" repose sur:
- redondance des disques (RAID) => maintenir le système fonctionnel >99%
du temps
- "snapshots", "at home" grâce à ZFS (http://zfsonlinux.org/), à
l'entreprise grâce à des filers propriétaire$ => archives "du pauvre"
- réplication asynchrone (mais régulière) des données ("snapshots" y
compris) sur un deuxième système => "disaster recovery"

Dans le cadre d'une utilisation "at home" et de ZFS (qui est
redoutablement stable et performant sous Debian), les deux SSD (de
faible capacité; 2x128GB) ne sont exploités que pour l'OS, le cache ZFS
de lecture (en mode "RAID-0") et le journal ZFS d'écriture (en mode
"RAID-1"), les données elles-même étant encore stockées sur des disques
rotatifs (avec l'équivalent ZFS d'un RAID-5 ou 6, en favorisant des
disques du plus faible capacité en plus grand nombre => augmentation des
performances grâce au "striping" inhérent au RAID et sécurité accrue
grâce à un RAID de niveau plus élevé).
Au final, pour un budget très raisonnable - et concurrentiel (compte
tenu de l'évolution du coût des SSDs de grosse capacité) - on obtient un
système digne d'une entreprise (avec $$$ à la clef), aussi bien en
termes de sécurité que de performances.
Les "snapshots" jouent le rôle "'archives", sécurisés grâce à une
réplication sur un deuxième système (ex: le petit "serveur" - HTPC,
stockage, cloud perso, etc. - allumé en permanence vers la station de
travail allumée au gré des besoins). ZFS rend cette réplication d'autant
plus facile et rapide grâce à sa fonctionnalité de réplication des
données au niveau "block" entre deux "snapshots".
Et pour finir, de temps en temps, une copie (rsync) sur un disque dur de
très grosse capacité, stocké hors site.

Au plaisir de continuer à vous lire,

Cédric


More information about the gull mailing list