シアソートで二次元格子を整列する
シアソートを使用する
シアソート (shear sort) は、要素を正方形の格子(√n × √n)に並べたうえで、行と列を交互に整列させていく比較ベースのソートである。
本質的には次の二種類のフェーズを繰り返す。
- 行フェーズ: 各行を、偶数行は左から昇順・奇数行は右から昇順(左へ値が大きくなる並び)になるように整える。いわゆる蛇行方向が交互になる行ソートである。
- 列フェーズ: 各列を、上から下へ昇順になるように整える。
格子の一辺の長さを r とすると、繰り返しはだいたい O(log r) 回で十分であり、全体として並列ステップ数は Θ(r log r)(要素数 N=r² に対して Θ(√N log N))に収まるとされる。出力の並びは一般に蛇行順で値が昇順になる配置になる。
バブルソートやクイックソートが一次元のインデックス列を直接いじるのに対し、シアソートは二次元インデックスと「同じ行・同じ列だけが比較される」という通信制約が前提になる点が対照的である。
procedure shear_sort_rows_then_cols(A, side)
repeat until snake_order_sorted(A, side)
for row from 0 to side - 1
if row is even then
sort_row_ascending_left_to_right(A, row)
else
sort_row_descending_left_to_right(A, row)
for col from 0 to side - 1
sort_column_ascending_top_to_bottom(A, col)
蛇行順で昇順になった時点では、行優先に左から読むとまだ入れ替わったように見えることがある。実運用や見やすい一次元配列に落とすときは、文献でも触れられるように仕上げでもう一度だけ行方向に処理を足す(このデモでは各行をすべて昇順にそろえる)と、行優先読みでも昇順になる。
一次元配列だけを対象にしたソートに比べて、列の交換では画面上離れた二本の棒が動く一方で、行内の交換は隣同士に見えるという違いが見える。
計算時間量および空間計算量を計測する
| Size | Average time | Maximum time | Average memory | Maximum memory |
|---|---|---|---|---|
| 256 | 0.000018 | 0.001078 | 1854 | 1860 |
| 512 | 0.000043 | 0.000630 | 1866 | 1872 |
| 1024 | 0.000088 | 0.000508 | 1878 | 1884 |
| 2048 | 0.000243 | 0.000611 | 1914 | 1920 |
| 4096 | 0.000598 | 0.004951 | 1978 | 1984 |
| 8192 | 0.001687 | 0.005320 | 2106 | 2112 |
| 16384 | 0.004316 | 0.006946 | 2212 | 2304 |
| 32768 | 0.012391 | 0.017377 | 2792 | 2816 |
| 65536 | 0.039612 | 0.052896 | 3816 | 3840 |
| 131072 | 0.097635 | 0.298610 | 5864 | 5888 |
| 262144 | 0.312589 | 0.737209 | 9960 | 9984 |
計測に使用したコードを表示する
set -euo pipefail
WORKDIR="$(mktemp -d)"
trap 'rm -rf "$WORKDIR"' EXIT
cat > "$WORKDIR/Dockerfile" <<'EOF'
FROM rust:1.95.0
WORKDIR /app
RUN mkdir -p src
RUN cat > Cargo.toml <<'CARGO'
[package]
name = "rust-benchmark"
version = "0.1.0"
edition = "2021"
[profile.release]
lto = true
codegen-units = 1
panic = "abort"
CARGO
RUN cat > src/main.rs <<'RUST'
use std::{
env,
process::Command,
time::{Duration, Instant},
};
const MIN_POWER: u32 = 8;
const MAX_POWER: u32 = 18;
const RUNS: usize = 8192;
fn insertion_sort(a: &mut [usize]) {
for i in 1..a.len() {
let mut j = i;
while j > 0 && a[j - 1] > a[j] {
a.swap(j - 1, j);
j -= 1;
}
}
}
fn shear_sort(a: &mut [usize]) {
let n = a.len();
if n <= 1 {
return;
}
let side = (n as f64).sqrt().ceil() as usize;
let mut grid = vec![usize::MAX; side * side];
grid[..n].copy_from_slice(a);
let phases = ((side as f64).log2().ceil() as usize + 1) * 2;
for _ in 0..phases {
for r in 0..side {
let row = &mut grid[r * side..(r + 1) * side];
insertion_sort(row);
if r % 2 == 1 {
row.reverse();
}
}
for c in 0..side {
let mut col: Vec<usize> = (0..side).map(|r| grid[r * side + c]).collect();
insertion_sort(&mut col);
for r in 0..side {
grid[r * side + c] = col[r];
}
}
}
let mut out = Vec::with_capacity(n);
for r in 0..side {
if r % 2 == 0 {
for c in 0..side {
if grid[r * side + c] != usize::MAX {
out.push(grid[r * side + c]);
}
}
} else {
for c in (0..side).rev() {
if grid[r * side + c] != usize::MAX {
out.push(grid[r * side + c]);
}
}
}
}
a.copy_from_slice(&out);
}
fn benchmark_sort(array: &mut [usize]) {
shear_sort(array);
}
fn shuffled(size: usize, seed: u64) -> Vec<usize> {
let mut v: Vec<usize> = (1..=size).collect();
let mut state = seed;
for i in (1..size).rev() {
state ^= state << 13;
state ^= state >> 7;
state ^= state << 17;
let j = (state as usize) % (i + 1);
v.swap(i, j);
}
v
}
fn memory_usage_kb() -> usize {
let contents = std::fs::read_to_string("/proc/self/status")
.unwrap_or_default();
for line in contents.lines() {
if let Some(rest) = line.strip_prefix("VmHWM:") {
let kb = rest
.split_whitespace()
.next()
.unwrap_or("0")
.parse::<usize>()
.unwrap_or(0);
return kb;
}
}
0
}
fn micros(d: Duration) -> u128 {
d.as_micros()
}
fn run_once(size: usize, seed: usize) -> (u128, usize) {
let expected: Vec<usize> = (1..=size).collect();
let mut array = shuffled(size, seed as u64);
let start = Instant::now();
benchmark_sort(&mut array);
let elapsed = start.elapsed();
if array != expected {
panic!(
"sort failed with seed {} for size {}",
seed,
size
);
}
(micros(elapsed), memory_usage_kb())
}
fn run_child(args: &[String]) {
let size = args[2].parse::<usize>().expect("invalid size");
let seed = args[3].parse::<usize>().expect("invalid seed");
let (elapsed_us, mem) = run_once(size, seed);
println!("{} {}", elapsed_us, mem);
}
fn main() {
let args: Vec<String> = env::args().collect();
if args.get(1).is_some_and(|arg| arg == "--run-once") {
run_child(&args);
return;
}
println!(
"| {:>10} | {:>15} | {:>15} | {:>15} | {:>15} |",
"Size",
"Average time",
"Maximum time",
"Average memory",
"Maximum memory"
);
println!(
"|{:-<11}:|{:-<16}:|{:-<16}:|{:-<16}:|{:-<16}:|",
"",
"",
"",
"",
""
);
for power in MIN_POWER..=MAX_POWER {
let size = 1usize << power;
let mut total_time: u128 = 0;
let mut max_time: u128 = 0;
let mut total_mem: usize = 0;
let mut max_mem: usize = 0;
for seed in 1..=RUNS {
let output = Command::new(env::current_exe().expect("failed to find current executable"))
.arg("--run-once")
.arg(size.to_string())
.arg(seed.to_string())
.output()
.expect("failed to run benchmark child process");
if !output.status.success() {
panic!(
"benchmark child process failed: {}",
String::from_utf8_lossy(&output.stderr)
);
}
let stdout = String::from_utf8(output.stdout)
.expect("child process returned non-UTF-8 output");
let mut fields = stdout.split_whitespace();
let elapsed_us = fields
.next()
.expect("missing elapsed time")
.parse::<u128>()
.expect("invalid elapsed time");
let mem = fields
.next()
.expect("missing memory usage")
.parse::<usize>()
.expect("invalid memory usage");
total_time += elapsed_us;
if elapsed_us > max_time {
max_time = elapsed_us;
}
total_mem += mem;
if mem > max_mem {
max_mem = mem;
}
}
let avg_time = total_time / RUNS as u128;
let avg_mem = total_mem / RUNS;
println!(
"| {:>10} | {:>15} | {:>15} | {:>15} | {:>15} |",
size,
format!("{}.{:06}", avg_time / 1_000_000, avg_time % 1_000_000),
format!("{}.{:06}", max_time / 1_000_000, max_time % 1_000_000),
avg_mem,
max_mem
);
}
}
RUST
RUN cargo build --release
CMD ["./target/release/rust-benchmark"]
EOF
docker build -t rust-benchmark "$WORKDIR"
docker run --rm --init rust-benchmark