编辑“︁C++ 内存对齐”︁（章节）

=== 案例：SIMD指令优化 ===
以下代码展示了如何使用对齐内存加速SIMD操作：

<syntaxhighlight lang="cpp">
#include <immintrin.h>
#include <iostream>

int main() {
    alignas(32) float array[8] = {1.0f, 2.0f, 3.0f, 4.0f, 5.0f, 6.0f, 7.0f, 8.0f};
    __m256 vec = _mm256_load_ps(array);  // 加载对齐的256位数据

    // 执行SIMD操作（例如乘以2）
    vec = _mm256_mul_ps(vec, _mm256_set1_ps(2.0f));

    // 存储结果
    _mm256_store_ps(array, vec);

    for (float val : array) {
        std::cout << val << " ";
    }
    std::cout << std::endl;

    return 0;
}
</syntaxhighlight>

'''输出'''：
<pre>
2 4 6 8 10 12 14 16
</pre>

'''解释'''：
- `alignas(32)`确保`array`对齐到32字节边界，满足AVX指令的要求。
- `_mm256_load_ps`和`_mm256_store_ps`要求输入/输出指针必须对齐，否则会导致未定义行为。