Quelques réflexions autour des disques
Il y a actuellement 3 grandes catégories de disques : HDD (Hard Disk Drive), SSD (Solid State Drive), SSD NVMe. Ce dernier étant le format le plus récent, je vous renvoie vers Tout savoir sur le NVMe pour comprendre les différences.
3,5 pouces avant et 2,5 pouces maintenant
Je vois un réel changement sur les serveurs dans l’univers professionnel. On a un certain nombre de slots sur un serveur. Depuis que j’ai débuté dans l’informatique, la majorité des serveurs que j’ai croisé avaient des slots 3,5 pouces, on peut y mettre des HDD en 7200 RPM, des HDD en SAS 10K/15K. À l’heure actuelle on assiste à un basculement lié à la performance des SSD. On a des slots 3,5 pouces sur les « vieux » serveurs avec des racks 3,5 pouces vers 2,5 pouces, en gros on met du SSD 2,5 pouces dans un rack 3,5 pouces.
Les nouvelles gammes de serveurs sont surtout centrées sur des slots de 2,5 pouces pour SSD classiques/NVMe, l’industrie et le client veulent de la rapidité/performance. De facto ça exclut les disques durs de 3,5 pouces. Aujourd’hui Intel propose du SSD NVMe 2,5 pouces en 15 To à la vente, le HDD devrait voir arriver du 18 et 20 To en 2020 (50 To prévu pour 2026). Je ne m’avance pas trop en disant que la capacité disque des SSD va dépasser rapidement celle des HDD.
Performance, RAID et coût
J’ai un client qui a des SSD de 3,8 To en disques principaux et des HDD de 10 To en stockage. Évidemment il y a toujours des contraintes (prix au Go) mais dans un contexte professionnel, les disques sont nécessairement en RAID. Un disque défectueux sur du HDD de cette capacité implique plusieurs heures de reconstruction au RAID : Les disques sont plus sollicités (par la synchronisation) donc moins performants (pour la lecture/écriture des données continuant sur le serveur), durant ce délai la grappe RAID est plus susceptible de se casser la gueule (puisqu’il manque un disque).
Nous avons reçu nos premiers SSD NVMe de 1 To, il faut 12 mn pour la construction/reconstruction d’un RAID 1 càd pour les personnes moins techniques, que l’intégralité des disques soit synchronisé. 12 mn.
Un HDD n’est plus seulement limitant, il devient pénalisant dans un contexte professionnel. À quel moment l’espace disque et son coût devient plus important/essentiel que la rapidité et viabilité d’accès à la donnée ?
Peut-on se permettre de perdre 6-8-10 To de données simplement parce que la capacité disque suit alors que le temps de reconstruction du RAID explose ? Où se situe le point de bascule ?
Usages
Pour moi dans un contexte professionnel les HDD ne doivent plus servir qu’à deux usages : Stockage (vidéos, images, nombreux fichiers peu/pas utilisés, etc.) et sauvegarde (des données). En revanche un HDD en production (« vraiment » utilisé) est à bannir.
Prenons l’exemple des données d’un Nextcloud sur du HDD, évidemment le coût de stockage est bien moins cher et on peut monter haut « facilement » avec du HDD de 6 To :
- Dans le cas du simple utilisateur, la logique est encore bonne pour peu que ces données ne soient pas vitales (il peut s’en passer quelques heures) et qu’il possède ABSOLUMENT une sauvegarde
- Dans le cas d’un professionnel où les données sont vitales, travailler avec du HDD est une grosse erreur. Changer un disque implique plusieurs heures pour reconstruire le RAID avec lenteurs et risques attenants. Réinjecter une sauvegarde pour (au pif) 5 To de données va prendre plusieurs heures, la vitesse d’écriture du disque étant le facteur limitant
Tout ceci est peut-être bien abstrait pour toi lecteur mais attendre plus de 6h (HDD de 6 To), 1h30 (SSD de 3,8 To) ou 12 mn (SSD NVMe de 1 To) à côté d’un serveur pour la reconstruction d’un RAID 1, fais réfléchir à la valeur qu’un professionnel porte aux données de ses clients, les vôtres.
Déjà 17 avis pertinents dans Quelques réflexions autour des disques
Les commentaires sont fermés.
Ça devient de moins en moins envisageable un RAID classique sur de telles capacités.
Il vaut mieux s’orienter vers des systèmes plus résilients pour les très grandes capacités. Avec des architectures basés sur de très grosses grappes de disques qui permettent d’en perdre plusieurs sans soucis pour l’intégrité des données.
Avec des systèmes à base d’algo de Reed-Solomon comme ce que documente pas mal BlackBlaze.
Je suis curieux d’avoir un retour sur les réécritures des SSD comparés aux HDD.
Je trouve ta question à la fois très intéressante et en même temps assez mal posée.
Sur le brouillon de cet article, j’avais commencé à écrire : que reste-t-il aux HDD ? En fait plus rien sauf le coût au Go :
1/ La capacité disque va être plus élevée sur SSD => Combien de R&D sur les SSD et sur les HDD ? J’ai mon idée sur la techno la plus porteuse ^^
2/ On voit de moins en moins de serveurs avec des slots de 3,5 pouces => Le choix va se réduire, ça va coûter plus cher
3/ Avoir des slots de 2,5 pouces peut permettre d’avoir un serveur en 1U (au lieu d’un 2U) => Gain de place, plus de serveurs dans une baie ou plus de disques dans la baie
4/ La rapidité inégalable des SSD
5/ Le SSD résoud le pb du RAID de grande capacité puisque avec sa vitesse, il abaisse considérablement le temps pour construire/reconstruire un RAID
Donc le RAID classique avec de grandes capacités, pas de pb avec du SSD, gros problèmes avec du HDD et c’est ce que je voulais souligner dans cet article. Backblaze avec leur business est obligé de chercher des solutions peu coûteuses et de grandes capacités = HDD mais du coup obligé de trouver des solutions. Ça ne remet pas en cause le fait que le RAID ça marche très bien, c’est un standard de fonctionnement pour tout le monde et qu’on le verra encore de très très nombreuses années. Comme je le disais dans l’article : SSD NVMe de 1 To synchronisés en RAID 1 **en 12 mn**. Je suis juste bluffé et je n’ai pas trop de doute vers quoi va tendre l’industrie.
Tcho !
Hummm je sais pas comment je dois prendre ton commentaire ^^
1/ La technologie SSD a maintenant plus de 10 ans, ça a évolué depuis ses débuts
2/ Quelques réponses sur https://www.ontrack.com/fr/blog/quelle-est-la-duree-de-vie-reelle-des-ssd/ et https://fr.wikipedia.org/wiki/SSD
3/ La majorité des SSD sont garantis 5 ou 10 ans maintenant
4/ Les professionnels utilisent des gammes professionnelles ou datacenter pour les disques, ils coûtent plus chers mais ont de meilleures performances comme la durée de vie. J’ai des SSD sur des serveurs qui ont déjà plus de 5 ans qui marchent encore parfaitement
5/ J’ai aujourd’hui plus confiance dans un SSD que dans un HDD, il ne faut pas penser que sur un seul critère comme la durée de vie. Récupérer les données dans un temps raisonnable, on le fait de moins en moins avec un HDD par exemple
Tcho !
Puisque tu parles du RAID, avec de gros volumes tu fais quoi ? Du RAID 6 ?
Parce que passé un certain volume, le 5 n’est plus fiable, le 1 au delà de 3 disques c’est pas utile, reste le 10.
Ton avis là dessus ?
Monsieur est exigeant dans ses questions ! Monsieur veut de la réponse sur un point orthogonal à l’article ! Ha ha
Alors déjà je ne fais pas du RAID sur du gros volume (dans mon job actuel) ensuite on ne peut pas faire une réponse précise sur une demande/question assez générale. Je suis plus sur du RAID 6 mais la dernière fois que j’ai dû en faire un j’ai fait un RAID 5+1. Tu fais un RAID 5 et tu as un disque qui sert à rien, qui n’est pas dans ta grappe RAID, que tu rajoutes direct au RAID si tu as un disque défaillant.
Tcho !
Je ne suis pas totalement convaincu par la valse technologique des ssd au niveau mtbf
Attention toutefois au SSD choisit. Selon le type, on peut avoir des mauvaises surprises, y compris sur la durée de vie.
Cependant, j’ai un gros bémol sur l’argumentaire que les HDDs n’ont plus aucun intérêt en environnement professionnel du fait des coûts en temps de reconstruction du RAID. Déjà, pour le temps, certains services peuvent se permettre d’être down pendant des heures; ex : le backup, dont tu parles, avec des données peu souvent accédées. Par ailleurs, si tu fais dans les très très gros volumes, les HDDs ont encore leur intérêt : pour faire de la haute densité/capacité dans un rack par exemple ou bien pour démultiplier l’architecture. Bha oui, les disques en grosse quantité, ça finit par coûter très cher (et avec des SSDs, j’en parle même pas !); du coup, avec les économies réalisées, tu peux parfois dédoubler ton archi, et ça, c’est encore mieux ! Reconstruction d’un RAID car un serveur est défaillant ? Pas grave, le deuxième prend le relais.
Ne pas utiliser un SSD sur son pc en 2020 c’est aimer se faire mal ^^
Tcho !
« certains services peuvent se permettre d’être down pendant des heures » « dédoubler ton archi » => Oui il y a toujours des exceptions, il faut également toujours tenir compte du contexte. Je parle d’un contexte classique, un client à un serveur avec des disques dessus.
Tcho !
Nickel, merci pour ta réponse détaillée !!
Personnellement, ma tour tourne encore sur un simple HDD parce que les SSD de 2 Tio (ou 2×1 Tio, à la limite) ça coûtait encore cher par rapport à un HDD. Ce n’est pas du masochisme, la machine tourne très bien la majorité du temps, seul Steam quand il DL à fond arrive à saturer à la fois le réseau, le disque, et le CPU. Ce qui fait que c’est plutôt correct en fait, au final.
Je rigolais of course, c’est un honneur de te recevoir ici ^^
Tcho !
Utiliser un HDD en disque principal c’est du masochisme ha ha ha
Tcho !
Hors usage professionnel, et encore hors usage serveur et cas métiers spécifiques, le SSD n’est pas démocratisé de ce que j’en vois.
N’allez pas me faire croire que les entreprises qui ont des flottes de laptops pour leurs cadres les migrent en SSD et ne parle pas des PME/TPE.
Déjà que les helpdesk et sysadmin fassent un boulot correct sur les OS qui peuvent durer des années sur HDD.
« […] dans l’absolu, les SSD sont plus fiables [que les HDD], et les pannes plus rares. Si certains arguent que la mémoire flash possède une durée de vie limitée, l’expérience montre qu’arriver aux limites de celle-ci (même en usage intensif) sort du cadre d’un usage considéré comme normal. Vous n’allez pas griller votre SSD en streamant en permanence, en jouant, en copiant des données. Sur un SSD estimé comme faible sur ce point (par exemple un Crucial P1 avec de la flash QLC) et en considérant que vous allez le garder 5 ans (ce qui peut sembler optimiste), il faut écrire ~220 Go par jour avant d’atteindre la valeur au-delà de laquelle le SSD ne sera plus garanti. De plus, dans la pratique, les tests empiriques montrent qu’il s’agit d’une valeur théorique et que la dépasser (même largement) n’amène pas directement une catastrophe. En résumé, ne vous inquiétez pas de la durée de vie de votre mémoire flash. »
Source : Canard PC Hardware, n°42, octobre-novembre 2019, page 31.
Et puis bon, de toute façon, vous êtes censés avoir des sauvegardes, non ?
Je pense que ça fait partie des croyances qui restent ancrées comme quoi les SSD sont moins fiables dans le temps. Pour ça que je rappelais dans un commentaire un peu plus haut :
1/ La technologie SSD a maintenant plus de 10 ans, ça a évolué depuis ses débuts
2/ https://www.ontrack.com/fr/blog/quelle-est-la-duree-de-vie-reelle-des-ssd/ et https://fr.wikipedia.org/wiki/SSD
3/ La majorité des SSD sont garantis 5 ou 10 ans maintenant
Tcho !