Ро-алгоритм Полларда

Ро-алгоритм ( $\rho$ -алгоритм) — предложенный Джоном Поллардом^[англ.] в 1975 году алгоритм, служащий для факторизации (разложения на множители) целых чисел. Данный алгоритм основывается на алгоритме Флойда поиска длины цикла в последовательности и некоторых следствиях из парадокса дней рождения. Алгоритм наиболее эффективен при факторизации составных чисел с достаточно малыми множителями в разложении. Сложность алгоритма оценивается как $O(N^{1/4})$ ^[1].

ρ-алгоритм Полларда строит числовую последовательность, элементы которой образуют цикл, начиная с некоторого номера n, что может быть проиллюстрировано, расположением чисел в виде греческой буквы ρ, что послужило названием семейству алгоритмов^[2]^[3].

История алгоритма

В конце 60-х годов XX века Роберт Флойд придумал достаточно эффективный метод решения задачи нахождения цикла, также известный, как алгоритм «черепаха и заяц»^[4]. Джон Поллард, Дональд Кнут и другие математики проанализировали поведение этого алгоритма в среднем случае. Было предложено несколько модификаций и улучшений алгоритма^[5].

В 1975 году Поллард опубликовал статью^[6], в которой он, основываясь на алгоритме Флойда обнаружения циклов, изложил идею алгоритма факторизации чисел, работающего за время, пропорциональное $N^{1/4}$ ^[6]^[1]. Автор алгоритма назвал его методом факторизации Монте-Карло, отражая кажущуюся случайность чисел, генерируемых в процессе вычисления. Однако позже метод всё-таки получил своё современное название — ρ-aлгоритм Полларда^[7].

В 1981 году Ричард Брент и Джон Поллард с помощью алгоритма нашли наименьшие делители чисел Ферма $F_{n}=2^{2^{n}}+1$ при $5\leq n\leq 13$ ^[8]. Скорость алгоритма сильно зависит лишь от величины наименьшего делителя исходного числа, но не от самого числа. Так, поиск наименьшего делителя седьмого числа Ферма — ${\begin{array}{lll}F_{7}=340282366920938463463374607431768211457=59\,649\,589\,127\,497\,217\cdot 5\,704\,689\,200\,685\,129\,054\,721;\end{array}}$ , занимает гораздо больше времени, чем поиск делителя двенадцатого числа Ферма (т.к. его делитель 114689 значительно меньше, хотя само число состоит более чем из 1200 десятичных цифр).

В рамках проекта «Cunningham project^[англ.]» алгоритм Полларда помог найти делитель длиной 19 цифр числа $2^{2386}+1$ . Большие делители также могли бы быть найдены, однако открытие метода факторизации с помощью эллиптических кривых сделало алгоритм Полларда неконкурентоспособным^[9].

Описание алгоритма

Оригинальная версия

Рассматривается последовательность целых чисел ${x_{n}}$ , такая что $x_{0}=2$ и $x_{i+1}=(x_{i}^{2}-1\,)(\mathrm {mod} \,N)$ , где $N$ — число, которое нужно факторизовать. Оригинальный алгоритм выглядит следующим образом^[10]^[6]:

1. Вычисляются тройки чисел

(x_{i},x_{2i},Q_{i}),i=1,2,...

, где

Q_{i}\equiv \prod _{j=1}^{i}(x_{2j}-x_{j})\,(\mathrm {mod} \,N)

.

Причём каждая такая тройка получается из предыдущей.

2. Каждый раз, когда число

i

кратно числу

m

(скажем,

m=100

), вычисляется наибольший общий делитель

d_{i}=\mathrm {GCD} (Q_{i},N)

любым известным методом.

3. Если

1<d_{i}<N

, то частичное разложение числа

N

найдено, причём

N=d_{i}\times (N/d_{i})

.

Найденный делитель

d_{i}

может быть составным, поэтому его также необходимо факторизовать. Если число

N/d_{i}

составное, то продолжаем алгоритм с модулем

N'=N/d_{i}

.

4. Вычисления повторяются

S

раз. Если при этом число не было до конца факторизовано, выбирается, например, другое начальное число

x_{0}

.

Современная версия

Пусть $N$ составное целое положительное число, которое требуется разложить на множители. Алгоритм выглядит следующим образом^[11]:

Случайным образом выбирается небольшое число $x_{0}$ ^[12] и строится последовательность $\{x_{n}\},n=0,1,2,...$ , определяя каждое следующее как $x_{n+1}=F(x_{n})\,(\mathrm {mod} \,\,N)$ .
Одновременно на каждом i-ом шаге вычисляется $d=\mathrm {GCD} (N,|x_{i}-x_{j}|)$ для каких-либо $i$ , $j$ таких, что $j<i$ , например, $i=2j$ .
Если $d>1$ , то вычисление заканчивается, и найденное на предыдущем шаге число $d$ является делителем $N$ . Если $N/d$ не является простым числом, то процедуру поиска делителей продолжается, взяв в качестве $N$ число $N'=N/d$ .

На практике функция $F(x)$ выбирается не слишком сложной для вычисления (но в то же время не линейным многочленом), при условии того, что она не должна порождать взаимно однозначное отображение. Обычно в качестве $F(x)$ выбираются функции $F(x)=x^{2}\pm 1(\mathrm {mod} \,N)$ ^[12] или $F(x)=x^{2}\pm a(\mathrm {mod} \,N)$ ^[13]. Однако функции $x^{2}-2$ и $x^{2}$ не подходят^[10].

Если известно, что для делителя $p$ числа $N$ справедливо $p\equiv 1\,(\mathrm {mod} \,k)$ при некотором $k>2$ , то имеет смысл использовать $F(x)=x^{k}+b$ ^[10].

Существенным недостатком алгоритма в такой реализации является необходимость хранить большое число предыдущих значений $x_{j}$ .

Улучшения алгоритма

Изначальная версия алгоритма обладает рядом недостатков. В настоящий момент существует несколько подходов к улучшению оригинального алгоритма.

Пусть $F(x)=(x^{2}-1){\bmod {N}}$ . Тогда, если $(x_{j}-x_{i})\equiv 0{\pmod {p}}$ , то $(F(x_{j})-F(x_{i}))\equiv 0{\pmod {p}}$ , поэтому, если пара $(x_{i},x_{j})$ даёт решение, то решение даст любая пара $(x_{i+k},x_{j+k})$ .

Поэтому нет необходимости проверять все пары $(x_{i},x_{j})$ , а можно ограничиться парами вида $(x_{i},x_{j})$ , где $j=2^{k}$ , и $k$ пробегает набор последовательных значений 1, 2, 3, …, а $i$ принимает значения из интервала $[2^{k}+1;2^{k+1}]$ . Например, $k=3$ , $j=2^{3}=8$ , а $i\in [9;16]$ ^[11].

Эта идея была предложена Ричардом Брентом в 1980 году^[14] и позволяет уменьшить количество выполняемых операций приблизительно на 25 %^[15].

Ещё одна вариация ρ-алгоритма Полларда была разработана Флойдом. Согласно Флойду, значение $y$ обновляется на каждом шаге по формуле $y=F^{2}(y)=F(F(y))$ , поэтому на шаге $i$ будут получены значения $x_{i}=F^{i}(x_{0})$ , $y_{i}=x_{2i}=F^{2i}(x_{0})$ , и НОД на этом шаге вычисляется для $N$ и $y-x$ ^[11].

Пример факторизации числа

Данный пример наглядно демонстрирует ρ-алгоритм факторизации (версия алгоритма, с улучшением Флойда), для числа N = 8051:

Таблица: факторизация числа 8051
n = 8051, F(x) = (x² + 1) mod n , x₀ = y₀ = 2
i	x_i=F(x_i-1)	y_i=F(F(y_i-1))	НОД(\|x_i − y_i\|, 8051)
1	5	26	1
2	26	7474	1
3	677	871	97

Используя другие варианты полинома $F(x)$ , можно также получить делитель 83:

Таблица: факторизация числа 8051
n = 8051, F(x) = (x² + 3) mod n , x₀ = y₀ = 2
i	x_i=F(x_i-1)	y_i=F(F(y_i-1))	НОД(\|x_i − y_i\|, 8051)
1	7	52	1
2	52	1442	1
3	2707	778	1
4	1442	3932	83

Таким образом, d₁ = 97, d₂ = 83 — нетривиальные делители числа 8051.

После нахождения делителя числа, в ρ-алгоритме предлагается продолжать вычисления и искать делители числа $N/d$ , если $N/d$ не является простым. В этом простом примере данного шага совершать не потребовалось^[11].

Обоснование ρ-алгоритма Полларда

Алгоритм основывается на известном парадоксе дней рождения.

Парадокс дней рождений, кратко:
Пусть $\lambda >0$ . Для случайной выборки из $l+1$ элементов, каждый из которых меньше $q$ , где $l={\sqrt {2\lambda q}}$ , вероятность того, что два элемента окажутся одинаковыми $p>1-e^{-\lambda }$ .

Следует отметить, что вероятность $p=0.5$ в парадоксе дней рождения достигается при $\lambda \approx 0.69$ .

Пусть последовательность $\{u_{n}\}$ состоит из разностей $x_{i}-x_{j}$ , проверяемых в ходе работы алгоритма. Определяется новая последовательность $\{z_{n}\}$ , где $z_{n}=u_{n}\,\mathrm {mod} \,q$ , $q$ — меньший из делителей числа $N$ .

Все члены последовательности $\{z_{n}\}$ меньше ${\sqrt {N}}$ . Если рассматривать её как случайную последовательность целых чисел, меньших $q$ , то, согласно парадоксу дней рождения, вероятность того, что среди $l+1$ её членов попадутся два одинаковых, превысит $1/2$ при $\lambda \approx 0.69$ , тогда $l$ должно быть не меньше ${\sqrt {2\lambda q}}\approx {\sqrt {1.4q}}\approx 1.18{\sqrt {q}}$ .

Если $z_{i}=z_{j}$ , тогда $x_{i}-x_{j}\equiv 0\,\mathrm {mod} \,q$ , то есть, $x_{i}-x_{j}=kq$ для некоторого целого $k$ . Если $x_{i}\neq x_{j}$ , что выполняется с большой вероятностью, то искомый делитель $q$ числа $N$ будет найден как $\mathrm {GCD} (N,|x_{i}-x_{j}|)$ . Поскольку ${\sqrt {q}}\leq n^{1/4}$ , то с вероятностью, превышающей $1/2$ , делитель $N$ будет найден за $1.18\times N^{1/4}$ итераций^[11].

Сложность алгоритма

Чтобы оценить сложность алгоритма, рассматривается последовательность, строящаяся в процессе вычислений, как случайная (разумеется, ни о какой строгости при этом говорить нельзя). Чтобы полностью факторизовать число $N$ длиной $\beta$ бит, достаточно найти все его делители, не превосходящие ${\sqrt {N}}$ , что требует максимум порядка ${\sqrt {N}}$ арифметических операций, или $N^{1/4}\beta ^{2}=2^{\beta /4}\beta ^{2}$ битовых операций.

Поэтому сложность алгоритма оценивается, как $O(N^{1/4})$ ^[16]. Однако в этой оценке не учитываются накладные расходы по вычислению наибольшего общего делителя. Полученная сложность алгоритма, хотя и не является точной, достаточно хорошо согласуется с практикой.

Справедливо следующее утверждение: пусть $N$ — составное число. Тогда существует такая константа $C$ , что для любого положительного числа $\lambda$ вероятность события, состоящего в том, что ρ-алгоритм Полларда не найдет нетривиального делителя $N$ за время $C{\sqrt {\lambda {\sqrt {N}}}}(\log N)^{2}$ , не превосходит величины $e^{-\lambda }$ . Данное утверждение следует из парадокса дней рождения^[17].

Особенности реализации

Объём памяти, используемый алгоритмом, можно значительно уменьшить.

 int Rho-Поллард (int N)
 { 
   int x = random(1, N-2);
   int y = 1; int i = 0; int stage = 2;
   while (Н.О.Д.(N, abs(x - y)) == 1)
   {
     if (i == stage){
       y = x;
       stage = stage*2; 
     }
     x = (x*x + 1) (mod N);
     i = i + 1;
   }
   return Н.О.Д(N, abs(x-y));
 }

В этом варианте вычисление требует хранить в памяти всего три переменные $N$ , $x$ , и $y$ , что выгодно отличает алгоритм в такой реализации от других методов факторизации чисел^[11].

Распараллеливание алгоритма

Алгоритм Полларда допускает распараллеливание с использованием как систем с разделяемой памятью, так и систем с распределенной памятью (передача сообщений), однако второй случай является наиболее интересным с практической точки зрения^[18].

Система с распределенной памятью

Существующий метод распараллеливания заключается в том, что каждый вычислительный узел исполняет один и тот же последовательный алгоритм, однако, исходное число $x_{0}$ и/или полином $F(x)$ берутся различными. Для упрощения распараллеливания, предлагается получать их из генератора случайных чисел. Однако такая параллельная реализация не даёт линейного ускорения^[19].

Предположим что есть $P$ одинаковых исполнителей. Если мы используем $P$ различных последовательностей (то есть различных полиномов $F(x)$ ), то вероятность того, что первые $k$ чисел в этих последовательностях будут различными по модулю $p$ , будет примерно равна $\exp({-k^{2}P}/2p)$ . Таким образом, максимальное ускорение можно оценить как $P^{1/2}$ ^[9].

Ричард Крэндалл предположил, что достижимо ускорение $O(P/(\log P)^{2})$ , однако данное утверждение пока не проверено^[20].

Система с общей памятью

Предыдущий метод, очевидно, можно использовать и на системах с общей памятью, однако, гораздо разумнее использовать единый генератор $F(x)$ ^[21].

Примечания

↑ ¹ ² Pollard, 1974, с. 521–528.
↑ Christensen, 2009, 3.3.3.0.
↑ Chatterjee, 2008, 5.2.2.
↑ Floyd, 1967, с. 636–644.
↑ Brent, 1980, An improved Monte Carlo factorization algorithm, с. 176.
↑ ¹ ² ³ Pollard, 1975, A Monte Carlo method for factorization, с. 176.
↑ Koshy, 2007, Elementary Number Theory with Applications.
↑ Childs, 2009, A Concrete Introduction to Higher Algebra.
↑ ¹ ² Brent, 1999, Some parallel algorithms for integer factorization..
↑ ¹ ² ³ Pollard, 1975, A Monte Carlo method for factorization.
↑ ¹ ² ³ ⁴ ⁵ ⁶ Ишмухаметов, 2011, с. 64.
↑ ¹ ² Mollin, 2006, с. 215—216.
↑ Золотых Н. Ю. Лекции по компьютерной алгебре. Лекция 11. ρ-метод Полларда. Архивная копия от 30 октября 2014 на Wayback Machine
↑ Brent, 1980, An improved Monte Carlo factorization algorithm, с. 176—184.
↑ Reisel, 2012, Selected Areas in Cryptography. Prime Numbers and Computer Methods for Factorization. 2nd ed..
↑ Cormen, 2001, Introduction to Algorithms. Section 31.9. Integer Factorization. Pollard's rho heuristic..
↑ Ишмухаметов, 2011, с. 63.
↑ Косяков, 2014, с. 12.
↑ Kuhn, 2001, Random Walks Revisited: Extensions of Pollard’s Rho Algorithm for Computing Multiple Discrete Logarithms, с. 212—229.
↑ Crandall, 1999, Parallelization of Polldar-rho factorization.
↑ Косяков, 2014, с. 19.

Литература

Василенко О. Н. Теоретико-числовые алгоритмы в криптографии. — М.: МЦНМО, 2003. — 328 с. — ISBN 5-94057-103-4. Архивная копия от 27 января 2007 на Wayback Machine
Ишмухаметов Ш. Т. Методы факторизации натуральных чисел: Учебное пособие / Захаров В.М.. — Казань: Казанский Университет, 2011. — С. 61—64. — 190 с. — ISBN 978-3-659-17639-5.
Косяков М.С. Введение в распределенные вычисления / НИУ ИТМО. — СПб., 2014. — 155 с.
Герман О.Н., Нестеренко А.Ю. Теоретико-числовые методы в криптографии. — М., 2012. — 300 с.
Соловьёв Ю. П., Садовничий В. А., Шавгулидзе Е. Т., Белокуров В. В. Эллиптические кривые и современные алгоритмы теории чисел. — М.: Ин-т компьют. исслед., 2003. — 192 с. — ISBN ISBN 5-939722-27-X.
Brent R. P. Некоторые параллельные алгоритмы факторизации чисел (англ.) = Some parallel algorithms for integer factorization. — 1999. — С. 7. — doi:10.1017/S0305004100049252.
Brent R. P. An improved Monte Carlo factorization algorithm (англ.) // BIT Numerical Mathematics. — 1980. — 1 June (vol. 20, iss. 2). — P. 176—184. — ISSN 1572-9125. — doi:10.1007/BF01933190.
Chatterjee S., Sarkar P. Introduction (англ.) // Identity-Based Encryption. — Boston: Springer US, 2008. — ISBN 978-1-59693-238-8.
Childs, Lindsay N. Congruences // Введение в высшую алгебру = Concrete Introduction to Higher Algebra. — 3-е изд. — USA: Springer, 2009. — С. 471—473. — 603 с. — ISBN 978-0-387-74725-5.
Chris Christensen. Review of Modern Cryptanalysis: Techniques for Advanced Code Breaking by Christopher Swenson // Cryptologia. — 2009. — 27 января (т. 33, вып. 1). — ISSN 0161-1194. — doi:10.1080/01611190802293397.
Cormen T.H., Leiserson C.E., Rivest R.L., Stein C. Алгоритмы: построение и анализ = Introduction to algorithms. — 2-е изд. — USA: MIT Press, 2001. — С. 897—907. — 1180 с. — ISBN 9780262032933.
Crandall R.E. Распараллеливание P-алгоритма факторизации Полларда (англ.) = Parallelization of Polldar-rho factorization. — 1999. Архивировано 6 июля 2010 года.
Koshy T. Congruences // Элементарная теория чисел и её приложения = Elementary Number Theory with Applications. — 2-е изд. — USA: Academic Press, 2007. — С. 238. — 771 с. — ISBN 9780123724878.
Kuhn F., Struik R. Random Walks Revisited: Extensions of Pollard’s Rho Algorithm for Computing Multiple Discrete Logarithms (англ.) // Selected Areas in Cryptography / Serge Vaudenay, Amr M.. — Springer Berlin Heidelberg, 2001. — P. 212—229. — ISBN 978-3-540-43066-7, 978-3-540-45537-0. — doi:10.1007/3-540-45537-x_17.
Mollin R.A. An Introduction to Cryptography / Rosen K.H.. — 2. — London: Chapman and Hall, 2006. — 413 с. — ISBN 9781584886181. Архивировано 4 марта 2016 года.
Pollard J. M. A Monte Carlo method for factorization // BIT Numerical Mathematics. — 1975. — Vol. 15, № 3. — P. 331–334.
Pollard J.M. Theorems on factorization and primality testing // Mathematical Proceedings of the Cambridge Philosophical Society. — 1974. — Т. 76, вып. 03. — С. 521–528. — ISSN 1469-8064. — doi:10.1017/S0305004100049252.
Pollard J. M. Методы факторизации и проверка простоты. (англ.) = Theorems on factorization and primality testing. // Математические Труды Кэмбриджского Философского Общества (Mathematical Proceedings of the Cambridge Philosophical Society). — 1974. — Т. 76, № 3. — С. 521. — doi:10.1017/S0305004100049252.
Reisel, H. Простые числа и компьютерные методы факторизации = Prime Numbers and Computer Methods for Factorization. — 2-е изд. — USA: Springer, 2012. — С. 183. — 464 с. — ISBN 978-0-8176-8297-2.
Robert W. Floyd. Nondeterministic Algorithms // J. ACM. — 1967. — Т. 14, вып. 4. — С. 636–644. — ISSN 0004-5411. — doi:10.1145/321420.321422.

[Pollard_article-1] ¹ ² Pollard, 1974, с. 521–528.

[Christensen_rho-2] Christensen, 2009, 3.3.3.0.

[Chatterjee_rho-3] Chatterjee, 2008, 5.2.2.

[Floyd_cycle_len-4] Floyd, 1967, с. 636–644.

[Brent_bit_20-5] Brent, 1980, An improved Monte Carlo factorization algorithm, с. 176.

[Pollard_bit-6] ¹ ² ³ Pollard, 1975, A Monte Carlo method for factorization, с. 176.

[Koshy-7] Koshy, 2007, Elementary Number Theory with Applications.

[Childs-8] Childs, 2009, A Concrete Introduction to Higher Algebra.

[BrentParallel-9] ¹ ² Brent, 1999, Some parallel algorithms for integer factorization..

[Pollard-10] ¹ ² ³ Pollard, 1975, A Monte Carlo method for factorization.

[Ishmuhammetov-11] ¹ ² ³ ⁴ ⁵ ⁶ Ишмухаметов, 2011, с. 64.

[Mollin_default_function-12] ¹ ² Mollin, 2006, с. 215—216.

[Zolotykh-rho-pollard-13] Золотых Н. Ю. Лекции по компьютерной алгебре. Лекция 11. ρ-метод Полларда. Архивная копия от 30 октября 2014 на Wayback Machine

[Brent_bit_20_article-14] Brent, 1980, An improved Monte Carlo factorization algorithm, с. 176—184.

[Reisel-15] Reisel, 2012, Selected Areas in Cryptography. Prime Numbers and Computer Methods for Factorization. 2nd ed..

[Cormen-16] Cormen, 2001, Introduction to Algorithms. Section 31.9. Integer Factorization. Pollard's rho heuristic..

[Ishmuhammetov_BD-17] Ишмухаметов, 2011, с. 63.

[Kosyakov_advantages_of_spreded_memory-18] Косяков, 2014, с. 12.

[Kuhn_lineral_tile-19] Kuhn, 2001, Random Walks Revisited: Extensions of Pollard’s Rho Algorithm for Computing Multiple Discrete Logarithms, с. 212—229.

[Crandall-20] Crandall, 1999, Parallelization of Polldar-rho factorization.

[Kosyakov_problems_of_spreded_memory_bottle_nack-21] Косяков, 2014, с. 19.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

Теоретико-числовые алгоритмы
Тесты простоты	Миллера Миллера — Рабина Люка — Лемера Пепина Агравала — Каяла — Саксены Соловея — Штрассена
Поиск простых чисел	Перебор делителей Решето Эратосфена Решето Аткина Решето Сундарама
Факторизация	Перебор делителей Метод Ферма p−1-метод Полларда ρ-алгоритм Полларда Метод Лемана Метод эллиптических кривых (алгоритм Ленстры) Алгоритм Диксона Квадратичное решето
Дискретное логарифмирование	Алгоритм Гельфонда — Шенкса Алгоритм Полига — Хеллмана ρ-метод Полларда Алгоритм «кенгуру» Полларда Алгоритм Адлемана Алгоритм COS
Нахождение НОД	Алгоритм Евклида Расширенный алгоритм Бинарный алгоритм
Арифметика по модулю	Алгоритм Монтгомери Китайская теорема об остатках
Умножение и деление чисел	Алгоритм Карацубы Алгоритм Тоома — Кука Алгоритм Шёнхаге — Штрассена Алгоритм Фюрера Алгоритм Харви — ван дер Хувена Алгоритм Бурникеля — Циглера
Вычисление квадратного корня	Алгоритм Тонелли — Шенкса Алгоритм Берлекэмпа — Рабина