奇偶マージソートを使用する

奇偶マージソート (odd-even merge sort) は、Batcher による 奇偶マージ ネットワークを再帰的に適用して配列を整列する比較ソートである。

前半・後半をそれぞれソートしたあと、偶数番地の部分列奇数番地の部分列を独立にマージし、隣接する奇偶ペアを比較交換することで2列を1本の昇順列へまとめる。

  1. 分割: 長さ n(2の冪)の区間を半分に分け、左右それぞれを再帰的に奇偶マージソートする。
  2. 奇偶マージ(再帰): 距離 r の要素同士を比較する前に、偶数側・奇数側の部分列へ同じマージを再帰適用する(r は 1, 2, 4, … と倍化)。
  3. 比較交換: 奇数側先頭から距離 r のペア (i, i+r) を順に比較し、大きい方を右へ送る。
  4. : 2r ≥ n になったら (lo, lo+r) の1ペアだけを比較交換して終了する。
procedure compare_exchange(A, i, j)
  if A[i] > A[j] then
    swap(A[i], A[j])

procedure odd_even_merge(A, lo, n, r)
  m = r * 2
  if m < n then
    odd_even_merge(A, lo, n, m)
    odd_even_merge(A, lo + r, n, m)
    for i from lo + r to lo + n - r - 1 step m
      compare_exchange(A, i, i + r)
  else
    compare_exchange(A, lo, lo + r)

procedure odd_even_merge_sort(A, lo, n)
  if n <= 1 then
    return
  m = n / 2
  odd_even_merge_sort(A, lo, m)
  odd_even_merge_sort(A, lo + m, m)
  odd_even_merge(A, lo, n, 1)

奇偶転置ソートが隣接ペアだけをラウンドごとに更新するのに対し、奇偶マージソートはすでに整列した部分列同士を奇数・偶数インデックスに分けてマージする点が異なる。要素数は2の冪を前提とする実装が一般的である。

逐次実行では時間計算量 O(n log² n) 、インプレース版では追加配列を使わず O(1) の補助記憶で済む(再帰スタックは別)。

比較のタイミングが規則的なため並列ソートの教材としてよく用いられ、等しいキーの相対順序を保たない 不安定 なソートとして分類されることが多い。

ビトニックソートと並べると、どちらも Batcher の並列ソートネットワーク由来である点が共通する。

奇偶転置ソートと名前が近いが、転置版は「全要素が昇順になるまで偶数相・奇数相を繰り返す」単純なネットワークであるのに対し、奇偶マージソートは 分割ソート+奇偶マージ の2段構造を持つ。

計算時間量および空間計算量を計測する

Size Average time Maximum time Average memory Maximum memory
256 0.000010 0.000360 1661 1668
512 0.000023 0.000352 1665 1672
1024 0.000055 0.000627 1674 1680
2048 0.000127 0.000643 1689 1696
4096 0.000286 0.000562 1722 1728
8192 0.000642 0.000823 1785 1792
16384 0.001454 0.001806 1917 1924
32768 0.004030 0.011511 2178 2184
65536 0.011155 0.151606 2690 2696
131072 0.032456 0.067621 3714 3720
262144 0.081530 0.602119 5762 5768
計測に使用したコードを表示する

set -euo pipefail

WORKDIR="$(mktemp -d)"
trap 'rm -rf "$WORKDIR"' EXIT

cat > "$WORKDIR/Dockerfile" <<'EOF'
FROM rust:1.95.0

WORKDIR /app

RUN mkdir -p src

RUN cat > Cargo.toml <<'CARGO'
[package]
name = "rust-benchmark"
version = "0.1.0"
edition = "2021"

[profile.release]
lto = true
codegen-units = 1
panic = "abort"
CARGO

RUN cat > src/main.rs <<'RUST'
use std::{
    env,
    process::Command,
    time::{Duration, Instant},
};
const MIN_POWER: u32 = 8;
const MAX_POWER: u32 = 18;
const RUNS: usize = 8192;
fn odd_even_merge(a: &mut [usize], lo: usize, n: usize, r: usize) {
    let m = r * 2;
    if m < n {
        odd_even_merge(a, lo, n, m);
        odd_even_merge(a, lo + r, n, m);
        let mut i = lo + r;
        while i + r < lo + n {
            if a[i] > a[i + r] {
                a.swap(i, i + r);
            }
            i += m;
        }
    } else if lo + r < a.len() {
        if a[lo] > a[lo + r] {
            a.swap(lo, lo + r);
        }
    }
}

fn odd_even_merge_sort_range(a: &mut [usize], lo: usize, n: usize) {
    if n <= 1 {
        return;
    }
    let half = n / 2;
    odd_even_merge_sort_range(a, lo, half);
    odd_even_merge_sort_range(a, lo + half, half);
    odd_even_merge(a, lo, n, 1);
}

fn odd_even_merge_sort(a: &mut [usize]) {
    if a.is_empty() {
        return;
    }
    odd_even_merge_sort_range(a, 0, a.len());
}

fn benchmark_sort(array: &mut [usize]) {

    odd_even_merge_sort(array);

}

fn shuffled(size: usize, seed: u64) -> Vec<usize> {
    let mut v: Vec<usize> = (1..=size).collect();

    let mut state = seed;

    for i in (1..size).rev() {
        state ^= state << 13;
        state ^= state >> 7;
        state ^= state << 17;

        let j = (state as usize) % (i + 1);

        v.swap(i, j);
    }

    v
}

fn memory_usage_kb() -> usize {
    let contents = std::fs::read_to_string("/proc/self/status")
        .unwrap_or_default();

    for line in contents.lines() {
        if let Some(rest) = line.strip_prefix("VmHWM:") {
            let kb = rest
                .split_whitespace()
                .next()
                .unwrap_or("0")
                .parse::<usize>()
                .unwrap_or(0);

            return kb;
        }
    }

    0
}

fn micros(d: Duration) -> u128 {
    d.as_micros()
}

fn run_once(size: usize, seed: usize) -> (u128, usize) {
    let expected: Vec<usize> = (1..=size).collect();
    let mut array = shuffled(size, seed as u64);

    let start = Instant::now();

    benchmark_sort(&mut array);

    let elapsed = start.elapsed();

    if array != expected {
        panic!(
            "sort failed with seed {} for size {}",
            seed,
            size
        );
    }

    (micros(elapsed), memory_usage_kb())
}

fn run_child(args: &[String]) {
    let size = args[2].parse::<usize>().expect("invalid size");
    let seed = args[3].parse::<usize>().expect("invalid seed");
    let (elapsed_us, mem) = run_once(size, seed);
    println!("{} {}", elapsed_us, mem);
}

fn main() {
    let args: Vec<String> = env::args().collect();
    if args.get(1).is_some_and(|arg| arg == "--run-once") {
        run_child(&args);
        return;
    }

    println!(
        "| {:>10} | {:>15} | {:>15} | {:>15} | {:>15} |",
        "Size",
        "Average time",
        "Maximum time",
        "Average memory",
        "Maximum memory"
    );

    println!(
        "|{:-<11}:|{:-<16}:|{:-<16}:|{:-<16}:|{:-<16}:|",
        "",
        "",
        "",
        "",
        ""
    );

    for power in MIN_POWER..=MAX_POWER {
        let size = 1usize << power;

        let mut total_time: u128 = 0;
        let mut max_time: u128 = 0;

        let mut total_mem: usize = 0;
        let mut max_mem: usize = 0;

        for seed in 1..=RUNS {
            let output = Command::new(env::current_exe().expect("failed to find current executable"))
                .arg("--run-once")
                .arg(size.to_string())
                .arg(seed.to_string())
                .output()
                .expect("failed to run benchmark child process");

            if !output.status.success() {
                panic!(
                    "benchmark child process failed: {}",
                    String::from_utf8_lossy(&output.stderr)
                );
            }

            let stdout = String::from_utf8(output.stdout)
                .expect("child process returned non-UTF-8 output");
            let mut fields = stdout.split_whitespace();
            let elapsed_us = fields
                .next()
                .expect("missing elapsed time")
                .parse::<u128>()
                .expect("invalid elapsed time");
            let mem = fields
                .next()
                .expect("missing memory usage")
                .parse::<usize>()
                .expect("invalid memory usage");

            total_time += elapsed_us;

            if elapsed_us > max_time {
                max_time = elapsed_us;
            }

            total_mem += mem;

            if mem > max_mem {
                max_mem = mem;
            }
        }

        let avg_time = total_time / RUNS as u128;
        let avg_mem = total_mem / RUNS;

        println!(
            "| {:>10} | {:>15} | {:>15} | {:>15} | {:>15} |",
            size,
            format!("{}.{:06}", avg_time / 1_000_000, avg_time % 1_000_000),
            format!("{}.{:06}", max_time / 1_000_000, max_time % 1_000_000),
            avg_mem,
            max_mem
        );
    }
}
RUST

RUN cargo build --release

CMD ["./target/release/rust-benchmark"]
EOF

docker build -t rust-benchmark "$WORKDIR"
docker run --rm --init rust-benchmark