剰余系による数値計算の例

modular arithmetic based calculation (including CRT)

2026-01-04

Takayuki HOSODA

概要

多桁の数を直接計算するにはハードウェア規模が Ο (n²) で増大し非現実的なサイズになってしまう。もし、多桁の数をくつかの小さな数のセットに分解して演算ができると、ハードウェアで数値演算回路を構成する場合にハードウェアの規模を小さくする事が出来る場合がある。多桁の乗算には FFT を用いた方法などがあるが、ここでは、中国人剰余定理 (Chinese remainder theorem) を利用した 剰余系 による数値計算を紹介する。

※ 但し、数千桁未満の場合や剰余系のまま計算を進められない場合、あるいはハードウェアでの剰余計算が利用できない場合には Karatsuba 法 などに対してメリットは薄い。
なぜなら、定数での剰余の計算もそれなりに計算コストが高いし、また通常の数に戻すときに逆元との積和で大きな数を扱わなければならないからである。

中国人剰余定理を利用した剰余系による数値計算法の例

例として２つの 9 bit の正の整数 A, B の自乗和を剰余系を使用し

X = A² + B²

を求めてみる。

まず、２つの 9 bit の自乗和は、高々 19 bit であるから

2¹⁹ = 524,288 ≤ d₁ d₂ … d_t

となる互いに素な任意の整数のセットを選ぶ。
例として {5, 7, 9, 11, 13, 16} を選ぶと、各要素の積 n は

2¹⁹ = 524,288 < n = 5 × 7 × 9 × 11 × 13 × 16 = 720,720

であるから上の条件を満たすのでこれを使用することにする。
与えられる２つの数を A, B とし、A = 357, B = 412 の場合を例にとって説明する。
A, B をそれぞれ {5, 7, 9, 11, 13, 16} で割った余りを求めると、

A₅  = 2 (mod  5),
A₇  = 0 (mod  7),
A₉  = 6 (mod  9),
A₁₁ = 5 (mod 11),
A₁₃ = 6 (mod 13),
A₁₆ = 5 (mod 16)

B₅  =  2 (mod  5),
B₇  =  6 (mod  7),
B₉  =  7 (mod  9),
B₁₁ =  5 (mod 11),
B₁₃ =  9 (mod 13),
B₁₆ = 12 (mod 16)

となる。それぞれの自乗の剰余 SA, SB を求め

SA₅  =  4 (mod  5),
SA₇  =  0 (mod  7),
SA₉  =  0 (mod  9),
SA₁₁ =  3 (mod 11),
SA₁₃ = 10 (mod 13),
SA₁₆ =  9 (mod 16)

SB₅  = 4 (mod  5),
SB₇  = 1 (mod  7),
SB₉  = 2 (mod  9),
SB₁₁ = 3 (mod 11),
SB₁₃ = 3 (mod 13),
SB₁₆ = 0 (mod 16)

それぞれの和の剰余 S を求めると

S₅  = 3 (mod  5),
S₇  = 1 (mod  7),
S₉  = 4 (mod  9),
S₁₁ = 6 (mod 11),
S₁₃ = 0 (mod 13),
S₁₆ = 9 (mod 16)

となり、剰余系において答えが求められた。
この剰余系のまま他の計算を進めることも出来るが、
この剰余系の数を普通の数に戻すには、 n / d の d_j における 乗法的逆元 すなわち

n / d_j · I_j ≡ 1 (mod d_j)

なる I_j を 拡張ユークリッドの互除法 (extended Euclid's algorithm) により求め、

I₅  = 576576,
I₇  = 205920,
I₉  = 320320,
I₁₁ = 196560,
I₁₃ = 277200,
I₁₆ = 585585

各剰余類と逆元の積和として、得ることが出来る。


X = ( (S₅  × I₅) (mod n)
    + (S₇  × I₇) (mod n)
    + (S₉  × I₉) (mod n)
    + (S₁₁ × I₁₁) (mod n)
    + (S₁₃ × I₁₃) (mod n)
    + (S₁₆ × I₁₆) (mod n) ) (mod n)
  = 297193 (mod n)

まとめ

このように、中国人剰余定理（CRT）に基づく数値計算は、演算を 小さく独立した計算に分解できる 点に大きな特徴があり、それらを 並列に実行できる、あるいは並列実行を前提として構成できる という点で魅力的である。さらに、互いに素な剰余の集合を自由に選択できるため、対象とするアーキテクチャや性能要件に応じて、 並列計算の粒度を調整できる という柔軟性を持つ。この柔軟性は、FFT を用いた方法とは異なり、ワード長、パイプライン段数、利用可能な並列資源といった ハードウェア制約に合わせて演算構造を設計できる ことを意味する。

一方で、実装にあたっては次の点を考慮する必要がある。

剰余演算に伴う計算コスト
乗法的逆元の計算および復元時に必要となる加算木を含めた全体最適化

DSP や FPGA においては、対象とするビット長や演算パターンによって、 Karatsuba 法、FFT による方法、剰余系による方法のいずれが有利になるかは大きく異なる。

多桁演算という観点で見ると、FFT による方法と CRT による方法はいずれも、大きな数を 直交する成分へ分解する という点で本質的に類似している。
すなわち、ある大きな数を直交する n 個の成分に分解できれば、計算は n 個の小さな演算に帰着される。
単位ベクトルを e^iω_nt とすれば、フーリエ変換となり、互いに素な整数の集合を用いれば中国人剰余定理となる。

剰余系による数値計算の例

概要

中国人剰余定理を利用した剰余系による数値計算法の例

まとめ

SEE ALSO