Mein NAS läuft nun seit vielen Jahren mit einem i3 4130. Das ist eine Haswell-CPU von ca 2013. Das NAS ist meistens im Standby und wird nur bei Bedarf via HomeAssistant eingeschaltet und kann von dort aus auch wieder in den Standby gesetzt werden.
Das Problem
Seit diversen Monaten kommt es vor, dass das NAS nach einiger Zeit beim Aufwecken hängen bleibt, teilweise auch bei größeren Transfers. Das Gerät ist an, aber via Ping (und auch auf allen anderen Wegen) nicht mehr erreichbar. Eine Kernel-Panic ist dann auch auf dem Bildschirm zu sehen. Ich weiß, dass das Mainboard einen Defekt hat, die USB-Ports funktionieren nicht mehr sauber. Von daher vermute ich dort irgendwo ein Problem.
Die mögliche Lösung
Ich habe ein gebrauchtes Bundle mit einem i3 6100, einem Mainboard (Gigabyte H110M-S03) und 8GB DDR4-RAM bestellt. Da die CPU ähnlich alt (ca 2015) ist, war das ganze mit unter 40 € auch entsprechend preiswert. Die Wahl fiel auch primär aufgrund des Preises auf so ein Bundle. Besondere Ansprüche an die CPU-Leistung oder den RAM habe ich nicht, da das Teil nur als Dateiserver dient und dort keine weiteren Services laufen. Daher ist das Downgrade von 16 GB auf 9 GB RAM auch okay.
Laut Benchmarks ist der i3 6100 etwa 20% schneller als der i3 4130, vor allem kann aber die Encoding-Engine der iGPU neben h.264 auch h.265 bzw. HEVC in Hardware kodieren. Das ist vor allem für einen Mediasever mit Transcoding hilfreich. Neuere Hardware wäre zwar nett, aber die zusätzliche Leistung brauche ich nicht, der geringere Stromverbrauch ist durch die nicht dauerhafte Nutzung nicht so relevant und Lust auf die deutlich höheren Kosten habe ich auch nicht. Von daher genügt Skylake.

Umbau
Hardware abseits von Mainboard/CPU/RAM:
- SATA-HBA mit 6 Ports (günstiges Modell mit einem ASM1166-Chip)
- 2,5 GBit/s Netzwerkkarte (günstiges Modell mit einem RTL8125B-Chip)
- Samsung 850 Evo mit 120 GB als Cache (hauptsächlich genutzt für Daten von Docker-Containern)
- 1x 4 TB HDD als Parity
- 3x 3 TB HDD als Datenplatten
- 1x 4 TB HDD als Datenplatte
Damit kommt eine nutzbare Kapazität von 13 TB zustande.

Der Umbau war höchst unkompliziert. Altes Mainboard raus, neues Mainboard rein, alles wieder verkabeln, fertig. unRAID ist weitestgehend egal, auf was für Hardware es gerade läuft, solange alle Festplatten noch da sind. An der Stelle war also nichts weiter zu tun, ich musste nur noch die neue MAC-Adresse im Router für die DHCP-Zuweisung und in HomeAssistant für Wake-on-LAN anpassen.
Parallel habe ich auch den USB-Stick für das unRAID OS getauscht. Vorher war es ein Transcend JetFlash 700 mit 16 GB, nun ist es ein Samsung BAR Plus mit 32 GB. Die Wahl fiel auf diesen Stick, da der im unRAID-Forum und auch im entsprechenden Subreddit empfohlen wurde. unRAID inkl. Lizenz auf den neuen Stick zu migrieren war auch recht einfach. Ich habe einfach mit dd den alten Stick auf den neuen kopiert, die Partition vergrößert und wieder bootbar gemacht. Die Lizenz lässt sich über unRAID bzw. deren Kundencenter auch recht einfach auf einen neuen Stick migrieren, da hatte ich allerdings kurz das Problem, dass zwei alte Keys (der ursprüngliche Trial-Key sowie ein Key von vor einem Lizenzupgrade) noch auf dem Stick waren. Die musste ich natürlich löschen.
Hat es geholfen?
Den Tausch habe ich Anfang Januar durchgeführt, das ist jetzt etwa 6 Wochen her. Seit dem ist der Fall nur noch ein einziges Mal eingetreten, spürbar seltener als vorher. Auch die Probleme bei größeren Transfers (oder teilweise auch nur Container-Updates) sind seit dem nicht mehr aufgetreten. Den fehlenden Arbeitsspeicher spüre ich nicht, die zusätzliche CPU-Leistung allerdings auch nicht.
Das es einen weiteren Crash gab ist natürlich nicht erfreulich. Daher werde ich mein IP-KVM an das NAS anschließen, um mir im Bedarfsfall zumindest die Kernel-Panic ansehen zu können. Falls es dabei Erkenntnisse gibt, werde ich einen weiteren Post schreiben.
Als weitere Ursache fällt mir eigentlich nur noch der HBA ein. Die Probleme sind älter als die Netzwerkkarte, daher denke ich nicht, dass dort ein Problem liegt. Theoretisch kann auch die SSD oder eine der HDDs einen Fehler haben, der zu Lesefehlern führt, aber das ist wahrscheinlich schwer zu diagnostizieren.
Fazit
Der Tausch war notwendig und durch die gebrauchte Hardware günstig. Das Endergebnis sieht gut aus, es läuft stabiler als vorher. Perfekt ist es allerdings weiterhin nicht. Vermutlich wäre es sinnvoll, das NAS dauerhaft laufen zu lassen; das möchte ich aber aufgrund des Stromverbrauchs und auch der Wärme- und Geräuschentwicklung nicht. Von daher werde ich mit dem neuen Stand erst einmal leben.