伊尔梅瑙工业大学 IT 中断:系统在短暂休息后重新上线!
伊尔梅瑙工业大学 IT 网络的故障影响了爱尔福特大学的系统。请受影响的用户保持耐心。

伊尔梅瑙工业大学 IT 中断:系统在短暂休息后重新上线!
2025 年 7 月 3 日,伊尔梅瑙理工大学的大学计算和媒体中心 (URMZ) 报告 IT 网络出现严重中断,这也影响了爱尔福特大学。这些中断影响了 Exchange、Outlook 和 Moodle 等重要系统的使用,导致大学运营受到严重干扰。
URMZ 宣布,问题的原因已经查明,他们正在积极努力解决问题。系统用户被要求在数据中心技术人员努力解决问题时保持耐心。下午 4:30 终于解除警报:系统再次完全正常运行,URMZ 感谢用户的耐心等待。
技术背景
伊尔梅瑙工业大学技术基础设施的一个重要组成部分是 GPU 计算集群,该集群于 2021 年 6 月安装。该集群由多个连接在一起的 NVIDIA GPU 组成,可大幅提高计算能力。具体来说,该集群包括:
- 7 GPU-Server
- 320 CPU-Cores
- 5 Terabyte Hauptspeicher (RAM)
- 36 NVIDIA A100 Tensor-Core GPUs
- 1,44 Terabyte Grafikspeicher insgesamt
- Verbindung über ein 200Gbit/s latenzarmes Netzwerk
通过组合这些组件,该集群能够有效地处理大量数据,这对于伊尔梅瑙工业大学未来的研究项目至关重要。目前,卡尔蔡司基金会资助的“智能制造工程(E4SM)”和2021年4月启动的校际项目“ThurAI”等项目都受益于这项最先进的技术。
网络安全挑战
然而,使用如此强大的集群也给网络安全领域带来了挑战。根据 LinkedIn 的一份报告,对数据中心日益增长的需求需要采取积极措施来保护敏感的研究数据和知识产权。这些数据可能包括个人身份信息 (PII) 或专有算法,丢失这些信息可能会对大学造成重大声誉损害。
风险很复杂,包括但不限于数据泄露、勒索软件攻击以及内部和外部参与者监视内部的风险。为了应对这些威胁,各种策略至关重要,包括:
- Risikobewertung zur Identifizierung von Bedrohungen und Schwachstellen
- Implementierung von Zugriffssteuerungen, um nur autorisierten Personen Zugriff zu gewähren
- Verschlüsselung von Daten sowohl im Ruhezustand als auch während der Übertragung
- Netzwerksegmentierung zur Isolierung von GPU-Clustern vom Hauptnetzwerk
- Regelmäßige Aktualisierung der Clusterkomponenten zur Minimierung von Schwachstellen
- Entwicklung von Notfallplänen zur schnelleren Reaktion auf Sicherheitsvorfälle
- Schulungen zur Sensibilisierung der Nutzer für Cybersicherheit
- Kontinuierliches Monitoring zur schnellen Erkennung von anomalies
实施这些措施对于确保学术研究的完整性以及维护利益相关者和公众的信任至关重要。大学必须继续共同努力应对数字时代的这些挑战。