Windows 高可用与虚拟化技术导航 / HA & Virtualization Guide

⚙️ Failover Clustering + Hyper-V + Storage Spaces Direct 构成了 Windows 高可用的三大支柱。

🔗 返回主导航图:Windows 技术生态导航图


Failover Clustering

故障转移集群 — Windows 高可用的核心框架。将多台服务器(节点)组成集群,当一个节点故障时自动将工作负载转移到其他节点(Failover)。支持 Hyper-V、File Server、SQL Server、DHCP 等角色的高可用部署。

核心概念: Cluster Node, Resource Group, Quorum (Witness), Heartbeat, Failover/Failback, CAU (Cluster-Aware Updating), Cluster Network, Affinity Rules

依赖关系: 需要 AD DS(身份验证)、DNS(名称注册)、TCP/IP(心跳网络)、共享存储(SAN/iSCSI/S2D/CSV)

资源 链接
📖 集群概述 Failover Clustering Overview
📖 创建集群 Create a Failover Cluster
📖 集群仲裁 Cluster Quorum
📖 CAU Cluster-Aware Updating
🔧 排查指南 Troubleshoot Clustering
🔧 内部 Wiki SHA Wiki

Hyper-V

虚拟化平台 — 微软的 Type-1 hypervisor,直接运行在硬件上。支持创建和管理虚拟机 (VM),提供隔离、快照、动态内存、SR-IOV、虚拟交换机等功能。与 Failover Clustering 集成实现 VM 高可用,是 Azure 计算服务的底层虚拟化引擎。

核心概念: VM Generation (Gen1/Gen2), Virtual Switch (External/Internal/Private), VHD/VHDX, Dynamic Memory, SR-IOV, Nested Virtualization, Shielded VM, Discrete Device Assignment (DDA)

资源 链接
📖 Hyper-V 概述 Hyper-V Technology Overview
📖 Hyper-V 网络 Hyper-V Virtual Switch
📖 Shielded VMs Shielded VMs
🔧 排查指南 Troubleshoot Hyper-V

Live Migration

实时迁移 — 在不中断服务的情况下将运行中的 VM 从一个 Hyper-V 主机迁移到另一个主机。利用 SMB 或压缩传输 VM 内存状态。支持集群内迁移和跨集群共享迁移 (Shared Nothing Live Migration)。

核心概念: Memory Pre-copy, SMB Transport, Compression, Shared Nothing Migration, Storage Migration

资源 链接
📖 Live Migration 概述 Live Migration Overview
📖 Storage Migration Virtual Machine Storage Migration

Cluster Shared Volumes (CSV)

集群共享卷 — 允许集群中的所有节点同时读写同一个卷的技术。是 Hyper-V 集群和 Scale-Out File Server 的存储基础。基于 NTFS 或 ReFS,通过 SMB 协议实现重定向 I/O。

核心概念: Direct I/O vs Redirected I/O, CSV Ownership, CSV Metadata, CSV Cache

资源 链接
📖 CSV 概述 Cluster Shared Volumes
🔧 排查指南 Troubleshoot CSV

Storage Spaces Direct (S2D)

存储空间直通超融合基础设施 (HCI) 的核心存储技术。将集群节点的本地磁盘池化为统一的软件定义存储。支持 NVMe、SSD、HDD 分层缓存,通过 SMB 在节点间通信。是 Azure Stack HCI / Azure Local 的技术基础。

核心概念: Storage Pool, Storage Tiers (NVMe/SSD/HDD), Virtual Disk, Resiliency (Mirror/Parity/Erasure Coding), Cache, Fault Domain, Storage Bus Layer (SBL)

资源 链接
📖 S2D 概述 Storage Spaces Direct Overview
📖 硬件要求 S2D Hardware Requirements
📖 部署指南 Deploy S2D

Storage Spaces (Standalone)

存储空间 — S2D 的单机版本。将多块物理磁盘池化为虚拟磁盘,提供镜像、奇偶校验、简单等弹性级别。适用于非集群场景的存储虚拟化。

资源 链接
📖 Storage Spaces 概述 Storage Spaces Overview

Storage Replica

存储副本 — 提供卷级别的同步或异步块级复制,用于灾难恢复。支持服务器到服务器、集群到集群、跨集群延伸集群三种拓扑。使用 SMB 进行数据传输。

核心概念: Synchronous/Asynchronous Replication, Source/Destination Group, Log Volume, Stretch Cluster, Test Failover

资源 链接
📖 Storage Replica 概述 Storage Replica Overview

Hyper-V Replica

Hyper-V 副本 — VM 级别的异步复制方案,将 VM 复制到另一个 Hyper-V 主机(可跨站点)实现灾备。支持 5 分钟 / 30 秒复制间隔和测试故障转移。

核心概念: Primary/Replica Server, Replication Frequency, Test Failover, Planned Failover, Extended Replication

资源 链接
📖 Hyper-V Replica 概述 Hyper-V Replica

高可用技术关系一览

graph TB
    FC["Failover Clustering<br/>HA 框架"] ==>|"集群化"| HV["Hyper-V"]
    FC ==>|"共享存储"| CSV["CSV"]
    FC ==>|"软件定义存储"| S2D["S2D"]
    
    HV -->|"实时迁移"| LM["Live Migration"]
    HV -->|"灾备复制"| HVR["Hyper-V Replica"]
    LM -->|"SMB 传输"| SMB["SMB"]
    S2D -->|"SMB 传输"| SMB
    S2D -->|"集群卷"| CSV
    SR["Storage Replica"] -->|"块级复制"| SMB
    
    FC -.->|"依赖"| ADDS["AD DS"]
    FC -.->|"依赖"| DNS["DNS"]
    FC -.->|"心跳"| TCPIP["TCP/IP"]
    CSV -->|"文件系统"| FS["NTFS/ReFS"]

    style FC fill:#ffd700,stroke:#b8860b,stroke-width:3px
    style HV fill:#d5e8f5,stroke:#2d6b8e,stroke-width:2px
    style S2D fill:#f9d5f5,stroke:#8e2d85,stroke-width:2px