線形オーダーのハノイの塔のプログラム

線形オーダーのハノイの塔のプログラム
(Hanoi's Tower Program in Linear Order)

by Akihiko Koga
30th July 2018 (Update)
14th July 2018 (First)

計算機（主にソフトウェア）の話題へ
ホームページトップへ戻る

English version of this page(translated partly yet).

1. 概要
2. ハノイの塔の問題と標準的な解法
3. 再帰呼び出し回数の改善
- 3.1 メモ化によるハノイの塔のプログラムの改善
- 3.2 タプリング戦略を使ったハノイの塔のプログラムの改善
4. 配列の結合の効率化
5. 結論と考察 : 計算とは何か？
6. 参考文献
付録
- A. タプリング戦略によるプログラム変換の自動化の試み（自分の論文の解説）
- B. Scheme による hanoi（高速版等）のプログラムの記述

1. 概要

ここで扱うのは再帰プログラムの例として良く出されるハノイの塔のプログラムを円盤の個数 n に対して線形の計算量 (つまり O(n)) で解けるように工夫するというものである．

ハノイの塔の解は 2ⁿ 手順からなるので，全部表示していてはそれだけで O(2ⁿ) かかる．したがって，ここでは手順をデータとして求めるだけで，それを表示するところは切り離して考える．以下の答えを見ると，それでもずるいと思う人もいるかもしれないし，これは最終的な解と呼べないんじゃないかと思う人もいるかもしれない．考え出すと，「計算って何だろう？」という問いに向かい合うような問題である．

なお，この方法は 34年前 (1984年) に修士論文でプログラム変換を考えていた時，できるはずだと思いつつ，面倒なので放っておいたもので，会社をやめて昨年やってみたらあっさりできたというものである（正確には，「出来たと思うことにした．」と言うのが正しいような気がする．解の手順を一次元に繋ぐのを諦めただけなので）．

2. ハノイの塔の問題と標準的な解法

ハノイの塔の問題は再帰プログラムを説明するときの例として良く出される問題である．図のように３つの場所 A, B, C があり，最初は A の場所に円盤が n 個おいてある．

それを１枚ずつ動かして全部を場所 B に移す問題である．ただし，円盤は大きさが皆異なり，大きな円盤を小さな円盤の上に置いてはいけないという制約がある．この制約を守りつつ，３つの場所を上手く使って全部を場所 B に持っていくという問題である．

この問題は，まず n-1 個の円盤をなんとかして場所 C に持って行って，おもむろに，一番大きな円盤を場所 A から場所 B に移動し，そして待避していた場所 C の n-1 枚の円盤を場所 C から，場所 B に写せばよい．例えば， Ruby で書くと，次のようになる．

  def hanoi(n, a, b, c)
    if (n == 0)
      # do nothing
    else
      hanoi(n-1, a, c, b)
      printf("Move disk %d from %s to %s\n", n, a, b)
      hanoi(n-1, c, b, a)
    end
  end

  hanoi(3, "A", "B", "C")

このように呼び出すと次のような解を表示してくれる．再帰定義とは，本当に便利な機能である．

  Move disk 1 from A to B
  Move disk 2 from A to C
  Move disk 1 from B to C
  Move disk 3 from A to B
  Move disk 1 from C to A
  Move disk 2 from C to B
  Move disk 1 from A to B

この定義だと人間には見やすいが，printf() という副作用がある関数を使っているので，次のように，解をリストとして返すように書き換えておこう．また，再帰呼び出しの回数を数えるために大域変数 $count1 を使っている．

  def hanoi(n, a, b, c)
    $count1 = 0
    hanoi1(n, a, b, c)
  end

  def hanoi1(n, a, b, c)
    $count1 += 1
    if (n == 0)
      []
    else
      hanoi1(n-1, a, c, b) +
      ["Move disk " + n.to_s + " from " + a + " to " + b] +
      hanoi1(n-1, c, b, a)
    end
  end

  hanoi(3, "A", "B", "C")

結果は次のようになる．

 ["Move disk 1 from A to B", "Move disk 2 from A to C", 
  "Move disk 1 from B to C", "Move disk 3 from A to B",
  "Move disk 1 from C to A", "Move disk 2 from C to B",
  "Move disk 1 from A to B"]

また，再帰呼び出しの回数 $count1 は 15 になる．

このプログラムの計算量は関数 hanoi() が呼び出される回数 C(n) を指標にとると，

  C(0) = 1
  C(n+1) = 2*C(n) + 1
  故に
  C(n) = 2ⁿ⁺¹ - 1

と，O(2ⁿ) になる．

注意：
以下で，関数の再帰呼び出しのオーダーを O(n) に変えるのだが，実は，配列の結合 [...] + [...] は前の配列の長さに比例するので，関数呼び出しだけを少なくしても，計算量はあまり変わらないということになる．

3. 再帰呼び出し回数の改善

ここでは，一度計算したものは何度も計算しないという方法で改善するのだが，これを実現する手段としては大きく二つある．

メモ化
計算した結果を覚えておいて，二度目はそれを使うという方法．
プログラム変換（タプリング戦略による）
定義を書き換えて，計算の重複をできるだけなくす方法．

以下に両方書いておく．

これはとても簡単な方法である．ハノイのプログラムは，第１引数の n は１つずつ引いていって 0 まで，後ろの３つは入れ替えているだけなので，最大 3! = 6 通り．したがって， hanoi(n, a, b, c) を呼び出したとき，最大でも 6*(n + 1) 通りの呼び出し方しかない．これらを計算したとき結果を覚えておいて，次に呼び出されたときには記憶していた結果を使えばよい．ここの空間が巨大だとメモ化はメモリー効率が悪くなるが，ハノイの塔の問題は手ごろである．また， Ruby には連想記憶というハノイの塔のプログラムのメモ化に便利なデータ型がある．次のプログラムは大域変数 $memo に結果を覚えるようにしてある．

  def hanoi2(n, a, b, c)
    $memo = {} # 計算結果を記憶しておくデータとして連想記憶を使う
    $count2 = 0
    hanoi2b(n, a, b, c)
  end

  def hanoi2b(n, a, b, c)
    $count2 += 1
    result = $memo[[n, a, b, c]]
    if result != nil then return result end
    if (n == 0)
      result = []
    else
      result =
        hanoi2b(n-1, a, c, b) + 
        ["Move disk " + n.to_s + " from " + a + " to " + b] +
        hanoi2b(n-1, c, b, a)
    end
    $memo[[n, a, b, c]] = result
    result
  end

# 結果を表示してしまうと時間がかかるので呼び出しは次のようにする．
xxx=hanoi2(10, "A", "B", "C"); nil
$count2       # hanoi2() の呼び出し回数は
55
xxx.length    # 解の長さは
1023          # 2**10 - 1 = 1023 なので確かに答えがでているみたい
xxx==hanoi(10, "A", "B", "C")
true          # 確かに答えはあってます

この例題では hanoi2() の呼び出し回数は， n=10 のとき 55 になっている．以前のプログラムでは 2¹¹-1=2047 回のはずなのでこれで多少は関数呼び出しの負荷は減るが，依然として配列を結合する負荷が高いのと，結果が大きいので，私の計算機では n が 20 を過ぎたあたりから急速に遅くなり，n = 30 は計算できなかった，というか，途中で止めた．なんせ， n=30 のときは解の長さが 2³⁰ - 1 = 1,073,741,823 なので，ちょっと辛い．スワッピングが起こって大変なのであまり大きな n でやらないようにしておいたほうが良い．私は，退職して収入が無くなったので計算機の買い替えはできるだけ控えたいという事情があるのだ．

これをさらに実際にリニアオーダーで動作するプログラムに改良する方に興味がある方は，ここからすぐに次の章の4. 配列の結合の効率化に進んで構わない．しかし，私としてはプログラム変換に興味があるので，ついででもよいので後で，「3.2 タプリング戦略を使ったハノイの塔のプログラムの改善」も少しだけ覗いていただけると嬉しい．

3.2 タプリング戦略を使ったハノイの塔のプログラムの改善

こちらは上のメモ化より多少難しいし，たぶん，効率はメモ化の方が少しよい．

最初から説明すると時間がかかるので，ここは天下り式に次のような関数

    hanoi_triple(n, a, b, c)

を考えてみる．（注意１）

    def hanoi_triple(n, a, b, c) 
      [hanoi(n, a, b, c), hanoi(n, b, c, a), hanoi(n, c, a, b)]
    end

このように定義すると， hanoi_triple(n-1, a, c, b) は

(*)     [hanoi(n-1, a, c, b), hanoi(n-1, c, b, a), hanoi(n-1, b, a, c)]

を計算することになる．実は，これらの式が計算されているとすると，上の元々の３つ組，

(**)    [hanoi(n, a, b, c), hanoi(n, b, c, a), hanoi(n, c, a, b)]

は計算できるのである．例えば，(**) の１番目は，(*) の１番目と２番目によって達成できることは最初のハノイのプログラムの再帰定義から明らかだから，真ん中の hanoi(n, b, c, a) を確かめてみる．

hanoi(n, b, c, a) （つまり，n 個の円盤を b から c に移動する）のは
    円盤 n-1 個を b から a に移動して ((*) の３番目 hanoi(n-1, b, a, c))，
    円盤 n を b から c に直接移動して，
    円盤 n-1 個を a から c に移動する ((*) の１番目 hanoi(n-1, a, c, b))

によって達成できる．(**) の３番目は自分で確かめて欲しい．

このような関係を見抜けば，hanoi_triple() を次のように自分を１回だけ再帰呼び出しする形に書き直すことができる．

# 次のプログラムの中で hanoi_triple(n, a, b, c) は，
#      [hanoi(n, a, b, c), hanoi(n, b, c, a), hanoi(n, c, a, b)] 
# を計算することを意図した関数である

def hanoi3(n, a, b, c)
  $count3 = 0
  hanoi_triple(n, a, b, c)[0]
end

def hanoi_triple(n, a, b, c)
  $count3 += 1
  if n == 0 then [[], [], []]
  else
    x = hanoi_triple(n-1, a, c, b)
    [x[0] + ["Move disk " + n.to_s  + " from " + a + " to " + b] + x[1],
     x[2] + ["Move disk " + n.to_s  + " from " + b + " to " + c] + x[0],
     x[1] + ["Move disk " + n.to_s  + " from " + c + " to " + a] + x[2]]
  end
end

yyy=hanoi3(10, "A", "B", "C"); nil
$count3    # 再帰呼び出しは 11 回
11
yyy==hanoi(10, "A", "B", "C")
true       # 答えはあってます

注意１:

このような補助的な関数を系統的に見つける方法を私は 1983年-1984年位の時期に修士論文のテーマとして考えていた．一応，論文として出した(参考文献)のだが，煩雑なことと，タイポも沢山あって読みにくかったせいか，だれも読んでくれていないように思う．時間ができたら，単純化してここで解説してみたいと思う．
ただし，ハノイの塔がこのようにリニアな呼び出しだけで書けるということ自身は，それより以前に Alberto Pettorossi 氏などが論文としてすでに出していた．私が取り組んだのは，このような補助的な関数の系統的な導入方法である．プログラム変換は劇的な効率改善ができることがあるのだが，補助的な関数を考え出すという人間のインテリジェンスを要求する．そこを少しでも自動化，あるいは，系統的な手法でできるようにしたかったのである．

4. 配列の結合の効率化
(Consideration on appending arrays)

このようにしてめでたく，メモ化，あるいは，タプリング戦略を使ったプログラム変換で再帰呼び出しは n にリニアなプログラムが出来たのだが，如何せん，配列の結合が配列の長さに比例した時間がかかるので，結果として O(2ⁿ) の時間が掛かってしまう．さらに，なにより，解を保存するメモリーとして O(2ⁿ) のメモリーを使ってしまう．

配列やリストの表現方法にはいろいろな方法がある．例えば，昔，論理型言語の Prolog には差分リストというものがあった．リスト２つ X と Y を用意して，X から Y を引いたものを表しているとするものだ．実際は，X と Y は一つのリストの２か所を保持していて， Y のところに何か追加して，Y をその後ろにずらすことで，後ろに簡単に要素がつけられるなど，リスト操作のいくつかが効率的にできるようになっている．

それにならって，計算結果の配列が必ずしも，意図するものの直接の配列表現になっていなくても，意図するものとしての解釈ができれば良いのではないかと考えてみた．ハノイの問題の解の中には多くの同一の移動列が複数回出現する．それらを共有してリンク構造だけで全体を表現する方法があれば，配列の結合も，解の移動列が占めるメモリーももっと効率よくできるのではないだろうかという訳である．

結果から言うと，移動列の断片自身に次につながるリンクを持たせるのではできない．同じ移動列が複数のコンテキストで使われている可能性があるからである．

そこで，例えば次のような約束事を決めてみたらどうだろう？

つまり，*expand* で始まる配列が要素部分にあれば，そこにそれを展開した配列を表しているとみるのである．これをこのまま実装してみてもよいのだがここで作成しているハノイの塔の場合は，移動操作は文字列で表しているので *expand* も省略して，途中の要素が配列ならそれはそこに展開するものという約束事としてみる（つまり，*expand* もサボって，

    [X1, X2, [Y1, Y2, Y3], X3, X4]
と書いてあったら
    [X1, X2, Y1, Y2, Y3, X3, X4]
と書いてあると思えということである）．

そうするとメモ化のプログラムは次のようになる．

  def hanoi2(n, a, b, c)
    $memo = {} # 計算結果を記憶しておくデータとして連想記憶を使う
    $count2 = 0
    hanoi2b(n, a, b, c)
  end

  def hanoi2b(n, a, b, c)
    $count2 += 1
    result = $memo[[n, a, b, c]]
    if result != nil then return result end
    if (n == 0)
      result = []
    else
      # 要は次の部分の配列の連結をやめて 3 つの要素のリストにしただけ
      result =
        [hanoi2b(n-1, a, c, b),
         "Move disk " + n.to_s + " from " + a + " to " + b,
         hanoi2b(n-1, c, b, a)]
    end
    $memo[[n, a, b, c]] = result
    result
  end

# 次の結果は，少しみにくいが "Move disk ..." の部分だけ追っていくと
# ハノイの塔の答えがでていることがわかる

xxx=hanoi2(3, "A", "B", "C")
 [[[[], "Move disk 1 from A to B", []], "Move disk 2 from A to C", 
 [[], "Move disk 1 from B to C", []]], "Move disk 3 from A to B",
 [[[], "Move disk 1 from C to A", []], "Move disk 2 from C to B", 
 [[], "Move disk 1 from A to B", []]]]

# このバージョンでは 100 個の円盤でも一瞬．再帰呼び出しは 595 回．

xxx=hanoi2(100, "A", "B", "C"); nil

$count2
595

一応，タプリング戦略によるプログラム変換のバージョンもこの形にしてみよう．

def hanoi3(n, a, b, c)
  $count3 = 0
  hanoi_triple(n, a, b, c)[0]
end

def hanoi_triple(n, a, b, c)
  $count3 += 1
  if n == 0 then [[], [], []]
  else
    x = hanoi_triple(n-1, a, c, b)
    [[x[0], "Move disk " + n.to_s  + " from " + a + " to " + b, x[1]],
     [x[2], "Move disk " + n.to_s  + " from " + b + " to " + c, x[0]],
     [x[1], "Move disk " + n.to_s  + " from " + c + " to " + a, x[2]]]
  end
end

hanoi3(3, "A", "B", "C")
[[[[], "Move disk 1 from A to B", []], "Move disk 2 from A to C", [[],
 "Move disk 1 from B to C", []]], "Move disk 3 from A to B", [[[], 
 "Move disk 1 from C to A", []], "Move disk 2 from C to B", [[],
 "Move disk 1 from A to B", []]]]

# n=1000 でも大丈夫です．移動操作列は 2¹⁰⁰⁰ - 1
hanoi3(1000, "A", "B", "C"); nil
$count3
1001

意味があるかどうか分からないが，n=1000 の時の円盤移動操作の長さは

  2¹⁰⁰⁰ - 1 = 
10715086071862673209484250490600018105614048117055
33607443750388370351051124936122493198378815695858
12759467291755314682518714528569231404359845775746
98574803934567774824230985421074605062371141877954
18215304647498358194126739876755916554394607706291
45711964776865421676604298316526243868372056680693
75

と302 桁の数になる( 1 行に 50 桁書いてある)．

ついで：
結果に空配列があるのが見苦しいので，そこだけは取り去ってみよう．

def hanoi3(n, a, b, c)
  $count3 = 0
  hanoi_triple(n, a, b, c)[0]
end

def hanoi_triple(n, a, b, c)
  $count3 += 1
  if n == 1 then
    ["Move disk " + n.to_s  + " from " + a + " to " + b,
     "Move disk " + n.to_s  + " from " + b + " to " + c,
     "Move disk " + n.to_s  + " from " + c + " to " + a]
  else
    x = hanoi_triple(n-1, a, c, b)
    [[x[0], "Move disk " + n.to_s  + " from " + a + " to " + b, x[1]],
     [x[2], "Move disk " + n.to_s  + " from " + b + " to " + c, x[0]],
     [x[1], "Move disk " + n.to_s  + " from " + c + " to " + a, x[2]]]
  end
end

hanoi3(3, "A", "B", "C")
[["Move disk 1 from A to B", "Move disk 2 from A to C",
  "Move disk 1 from B to C"],
 "Move disk 3 from A to B",
 ["Move disk 1 from C to A", "Move disk 2 from C to B",
  "Move disk 1 from A to B"]]

5. 結論と考察 : 計算とは何か？
(Conclution : What is a computation)

ここではメモ化やプログラム変換を使って，ハノイの塔のプログラムを円盤数 n に対して，リニアなオーダーの再帰呼び出しで解くプログラムに改善する方法を述べた．また，解のデータ構造を改善して，実際の計算時間もリニアになるように工夫した．

しかし，ここで読者には疑問というか不満があるに違いない．「本来，解は線形の配列（またはリスト）で表現されていたのに，ここでやったようにかなり深くネストして表現されていて良いのだろうか？」と．これを人の目に分かりやすく見せるためには，配列のネストを解いて，一次元に並べる必要があり，その作業を残して，解を得たと言えるのだろうか．まだ，解答の途中なのではないだろうかと．

実は私もこれは疑問のままである．例えば，遅延評価の機構を持った言語でハノイの塔を普通に再帰的に解くと，まったく具体的な計算を行わずに計算が終わり，結果の中の，例えば３番目の移動操作を調べに行ったところで始めて必要な計算がなされ，その移動操作がユーザに提示される．このとき，最初の解を求めるプログラムの計算量は O(1) と言えるのだろうか？今回提示した解でのネストを許したものが解と言えるなら，こちらも解と言えるような気もする．違うところがあるとするなら，我々がやった方は，

移動操作に関しては，具体的な操作まで完全に求められているのに対して，遅延評価のプログラムの場合は，それらがまだ計算されていないということ

くらいである．

今回の実験や考察は，「計算」というものに対する何か深遠なるものを我々に投げかけているような気もするし，案外，たわいもない話なのかもしれない．もしかしたら．この問題で求められるものが何かということがぶれているだけのことかもしれない．

6. 参考文献 (References)

1983年から1984年に，私自身が取り組んでいたときの参考文献なのでかなり古いものばかりであり，申し訳ない．また，最近の状況もサーベイしてみようかと思う．きっと，いろいろ新しいことが考えられているのだろうと思う．しかし，他方，まだ，プログラム変換が実用的に使われているということもあまり聞かないから，まだ，いろいろ考えるべきこと，考えたら面白いことがあるんだと思う．

私の( Akihiko Koga) も，探したら PDF が見つかったのでリンクを貼っておく．かなり煩雑なのとタイポがあるので，ここの付録で簡単に解説した．

R. M. BURSTALL AND JOHN DARLINGTON : A Transformation System for Developing Recursive Programs, JACM 24, 1, 1977, pp44-67
Pettorossi, A.: Towers of Hanoi Problems: Deriving Iterative Solutions by Program Transformations. BIT 25(2): 327-334 (1985)
Pettorossi, A.: Improving Memory Utilization in Transforming Recursive Programs (Extended Abstract). MFCS 1978: 416-425
Pettorossi, A.: Transformation of Programs and Use of "Tupling Strategy", Proc. of Informatica '77 Conference, Bled, Yugoslavia, 3-103, 1977, pp. 1-6
Pettorossi, A., Burstall, R.M.: Deriving Very Efficient Algorithms for Evaluating Linear Recurrence Relations Using the Program Transformation Technique. Acta Informatica 18 Springer Verlag (1982) 181–206
Akihiko, Koga : On Program Transformation with Tupling Technique, RIMS Symposia on Software Science and Engineering ||, 1983 and 1984: Kyoto, Japan, Lecture Notes in Computer Science 220, 1985, pp. 212-232
数理解析研究所講究録 (1985), 547: 128-155

付録 (Appendices)

付録 A. タプリング戦略によるプログラム変換の自動化の試み
(Explanation of the (semi-)automation of program transformation with tupling strategy)

(私の昔の論文 "On Program Transformation with Tupling Technique" の解説)

Program transformation technique sometimes improves programs drastically. However, it usually requires 'EUREKA step' by human, say, introducing an auxiliary function in the case of using tupling strategy.

We studied the method of introducing an auxiliary function for tupleing strategy (semi-)automatically.

このページで行ったハノイの塔のプログラムのプログラム変換は参考文献の

Akihiko, Koga : On Program Transformation with Tupling Technique, RIMS Symposia on Software Science and Engineering ||, 1983 and 1984: Kyoto, Japan, Lecture Notes in Computer Science 220, 1985, pp. 212-232

によったものである．自分で言うのもなんだが，その論文はとても読みにくい（タイポもかなりある）．見栄を張って少し対象を広げ過ぎたので記述が煩雑になってしまった．複数の関数がお互いに再帰的に呼び合う，相互再帰の定義を対象としたため記号がたくさん登場し，添え字も何段階かになって大変だった．あと，文章も拙いし，当時は数学的知識（主に半群論）もあまりなかった（きっと，そのときの反省から，私は今，半群論を勉強しよう (Let's Study Semigroup Theory) で半群を勉強しているのだと思う）．

と言うことで，ここで簡単に解説してみたいと思う．

上に書いたような３０数年前の失敗を避けるために，ここでは定義される関数記号を１つだけにして，元の論文をかなり単純化したエッセンスだけを述べる．もともと，この形で考えて，後で複数関数に拡張したのだし．そのような制限をしても，ハノイの塔など良く出会うプログラムで重複計算を少なくするようなプログラム変換の方法を発見するのに参考になると思う．また，元のプログラムに複数の関数記号が現れる場合は，それらを１つにする工夫をしてから適用できる場合もある．

なお，「背景と目的」は，このページの場合，すでに読者は動機づけられているように思ったので一番最後に回した．あまりプログラム変換に詳しくない人は，そちらから読むのがよいと思う．

タプリング戦略によるプログラム変換の対象プログラム
(Target programs for the transfomation with tupling strategy)
再帰定義書き換え用のタプル発見問題の定式化
(Formulation of the problem to discover a tuple for the transformation)
タプル発見ノウハウに利用できるいくつかの定理
(Theorems useful for discovering an appropriate tuple)
プログラムの書き換えについて
(The transformation of the programs usign tuples)
結論(Conclusion)
本解説を理解するための数学的定義と諸定理
(Preliminary knowledge in mathematics for this paper)
元の論文との差(Differences from the original paper)
背景と目的(Background)

本文

タプリング戦略によるプログラム変換の対象プログラム
(Target programs for the transfomation with tupling strategy)
最初に述べたようにここでは一つの関数を再帰定義する場合だけを扱う．対象とするプログラムの記述言語は特に具体的なものは与えない．なんとなく，関数型言語っぽい記述で，if や where などの構文を持つものを想定する．また，それらの意味は出てきたところで適宜説明する．実際に適用する場合には，利用者が，適宜，そのとき使う言語で提供されるものに置き換えて欲しい．
対象とするプログラムは次の形をしているとする（<= の左辺が右辺で定義されているという意図である）．
```
  f(x) <= Φ(f(σ₁(x)), ..., f(σ_n(x)))

	ここでΦ(...) は，一般には関数適用や if 文を含んだプログラムで，
	σ₁, ..., σ_n は，x に対する何らかの既知関数とする．
```
ここでは定義される関数は１引数の関数として書いたが，これはベクトルだと思えば，実際には何引数でも構わない．記述を単純にするためだけであり，本質的な制限にはなっていない．
このような関数定義の例としては，タプリング戦略のプログラム変換でよく例として引き合いに出されるフィボナッチ数を求めるプログラムがある．
```
 fib(n) <= if (n=0 or n=1) then 1 else fib(n-1) + fib(n-2) end

         ここで，我々が考えるプログラミング言語は
                if ... then ... else ... end 
         というような構文があり，常識的な意味を持っていると思ってほしい．
```
などで，この場合のσ₁, ..., σ_n は
σ₁ = λn.n-1
σ₂ = λn.n-2 = σ₁・σ₁=σ₁²

ここで，λx.Φ(x) は引数 x をもらい，Φ(x) を返す関数を表す記法で， λ記法と呼ばれるものである．数学では，例えば，x² + y² という表現は文脈により色々な意味に解釈される．つまり，（１）x と y に何か値が決まっていて，こういう式の値を表す場合，（２）x と y を受け取り， x² + y² を返す関数を表す場合，（３）y はどこかである値に固定されていて， x を受け取りx² + y²を返す関数を表す場合と，文脈により色々な解釈ができてしまう．λ記法は，その解釈を厳密に表現する記法と思って欲しい．結構便利である．私は数学の分野にも浸透することを願っている．
この例を最初に書いた対象プログラムの図式で書くと
```
  fib(n) = Φ(fib(σ₁(n)), fib(σ₁²(n)))
```
この大雑把な図式の表すところは，
n に対する fib を求めるためには，σ₁(n) と σ₁²(n) に対する fib を求めればよい

という依存関係である．ということで本質的な部分は再帰呼び出しの時に引数に適用される関数
{σ₁,σ₁²}
の部分である．次の章では，この部分を取り出し，プログラム変換の時に補助関数として定義するタプルの候補を見つけるという問題を定式化する．
ちなみにフィボナッチ数を求めるプログラムは次のように fib(n) と fib(n-1) の対（タプル）を同時に計算する関数 fib_pair(n) を導入すると，もとは n に対して指数関数的な再帰呼び出しが行われていたのが，n のオーダーの再帰呼び出しになる．
```
   fib(n) <= u where [u, v] = fib_pair(n)
   fib_pair(n) <= if (n = 0 or n = 1) then [1, 1]
                  else
                    [u+v, u] where [u, v] = fib_pair(n-1)
                  end

            ここで，[u, v] は，値 u と v の組（タプル）を表し，
            u where [u, v] = fib_pair(n) は，まず，fib_pair(n) を
            呼び出して，その結果で u と v を決めて，その変数設定のもとに
            u を返すと読んで下さい．fib_pair(n) の中で使われている where も
	    同様の意味です．
```
このときの関数の呼び出し関係は，後回しにした「背景と目的」にあるので，計算オーダーの違いをイメージしにくい人はそこを見て欲しい．
再帰定義書き換え用のタプル発見問題の定式化
(Formulation of the problem to discover a tuple for the transformation)
ここでは，「再帰関数の呼び出し関係から，タプリング戦略のプログラム変換で使える補助関数を表すタプルの候補を見つける問題」を定式化する．

定義2.1 (再帰定義の「依存性」)
プログラム
f(x) <= Φ(f(σ₁(x)), ..., f(σ_n(x)))
に対して，関数の集合
{σ₁, ..., σ_n}
を，その依存性(dependency) と呼ぶ．依存性は，D, D₁ などの文字であらわす．依存性は，実際の再帰関数定義の時に現れる既知関数の集合なので常に有限集合であるとしておく．

以後，f の引数に適用される関数 σ₁, ..., σ_n などを， σ₁・σ₁, σ₂・σ₁, ... など，色々な組み合わせで合成して，タプルの候補を探すことになる．したがって，これらの関数が合成されてできる空間を固定しておくと考えやすい．このような空間はモノイド(monoid)と呼ばれる代数系になる．モノイドとは，演算が１つ定義された代数系で，結合法則を満たし，単位元を持つものである．M をモノイド，・をその演算とすると次の２つが要求される．
さらに，すべての要素に逆元が存在すれば群 (group) である．以下では，関数の合成が作るモノイドを考えるので，演算は関数合成であり，また，単位元 e は恒等変換（引数と同じものを返す関数）で id と書くことにする．これは，id(x) = x という関数である（λ記法で書けば，id = λx.x）．
以下の議論では，依存性を含む関数空間がなす何らかのモノイド M が想定されているものとする（通常，生成元の集合 B から生成される最小のモノイドを [B] と書くので，この記法に従えば，M = [D] とすればよい）．M は，特に有限集合に限るという訳ではない．例えば，D = {λn.n-1} とすれば，M = [D] は， {λn.n-a | a は整数} となり，整数の集合がなす加法群 Z と同型の群（当然モノイドでもある）になる．
いくつか，関数の集合がなすモノイドに対する記法を定義しておく．
定義2.2 (モノイドに関する記法いくつか)
M を我々が考えている関数のモノイドとする．σ, ρ ∈ M，A, B ⊆ M, n を 0 以上の整数とするとき，これらの演算を次のように定義する．
注意：AB やσA などは，モノイドの掛け算が行われていることを強調したいときは，間に「・」を入れて，A・B, σ・A などと表すこともある．
最後に，タプリング戦略でのプログラム変換の際に導入する補助関数を表すタプル候補の概念を定義する．
定義2.3 (c-タプル，リニア c-タプル)
D = {σ₁, ..., σ_n} を依存性とし，M を D ⊆ M なるモノイドとする．
A ⊆ M と T ⊆ M の組 (A, T) が D の c-タプル（c は「候補（candidate）」の意味）であるとは，それらが次の性質をみたすことであるとする．
特に |A| = 1 の場合は重要なので，その場合の c-タプルをリニア c-タプルと呼ぶことにする．
依存性 D に対して，c-タプル (A, T) が見つかったときの，それぞれの集合の要素間の関係を次の図2.1に示す．T の中の各要素 τ は，
1. τ が Tα₁, ..., Tα_m の中のどれかの中に直接現れる場合
2. τ そのものは Tα₁, ..., Tα_m の中に直接には現れないが，Dτ がそれらの中にすべて現れている場合（図では隣あって現れるようにみえるが実際は，飛び飛びにかき集めてきて，それらをあわせてDτになることが一般的である）
のどちらかの条件を満たす．つまり，T の要素は，Tα₁, ..., Tα_mの要素を使って，依存関係 D を使い，すべて定義することができるという条件を満たしている．

図2.1 c-タプル (A, T) における T, TA の要素間の関係

c-タプル (A, T) は，タプリング戦略で，もとの再帰定義を書き換えるタプルの候補を意図している．２つの成分のうち，T の方がタプルの形の補助関数
h(x) = [h(τ₁(x)), ..., h(τ_n(x))]
を表している．A = {α₁, ..., α_m} とすれば，補助関数 h(x) は，何らかの記述 Φ を使って，
h(x) = Φ(h(α₁(x)), ..., α_m(x))
と，再帰的に書き換えられるわけである．この再帰定義Φの中ではもちろん再帰が止まる条件などが if 文などを使って書き込まれているとする．
このように，新しい再帰関数を定義するとき，再帰をA の元に関して書くことを意図しているので，f(x) を計算するのに，A の元を組み合わせていって再度 f(x) を計算することになる状況，つまり，計算が循環してしまうことは望ましくない．これを禁止するのに３番目の条件
A^s (s > 0) には id は入っていない
を付けている．
c-タプル (A, T) が見つかったとする．しかし，読者は，このようなプログラムの書き換えを行ったとき，引数に対する色々な関数適用の組み合わせがなされ，元の定義では呼び出されなかった引数の値に対して計算が要求されるかもしれないという心配を持つかもしれない．これは妥当な心配であるが，当面は，記述 Φ をうまく行うことによって「知的に」回避するものとする．
c-タプルの中で，A が唯一の要素からなるとき（singleton set であるとき）は，１つだけの再帰呼び出ししか持たない再帰関数に変換できる可能性があるということであり，特に重要である．この場合は，もとの指数関数的な計算量が線形のオーダーの計算量になる可能性がある．この場合の c-タプルを，リニア c-タプルと特別な名前を付けた．
例
先の例のフィボナッチ関数の依存性は D = {σ, σ²} だった．ここに，σ=λn.n-1 である．次のものはこの D の c-タプルである．
(A, T) = ({σ}, {id, σ})
c-タプル (A, T) の意図としては，T が補助関数として導入するタプルを表し， A は，それを再帰定義として表すとき，再帰的に呼ぶ引数に適用する関数の集合を表している．したがって，フィボナッチの例だと，
```
  fib_pair(n) = [fib(id(n)), fib(σ(n))] = [fib(n), fib(n-1)] 
```
を意図するタプルを導入し，それを fib_pair(σ(n)) = fib_pair(n-1) で表現するのである．つまり，先に書いた
```
  fib(n) <= u where [u, v] = fib_pair(n)
  fib_pair(n) <= if n < 2 then [1, 1]
                 else
                   [u+v, u] where [u, v] = fib_pair(n-1)
                 end
```
である．この場合は，元の指数関数的な計算量が線形の計算量に改善されている．
タプル発見ノウハウに利用できるいくつかの定理
(Theorems useful for discovering an appropriate tuple)
ここではc-タプルを見つけるための色々なノウハウ，つまり，どんなときに存在するか，どんなときにある種のc-タプルが存在しないかなどのノウハウを定理の形として述べる．特に証明に興味のない方は，まず，定理とその後ろにある応用例を見ていき，あとで，証明を追いかけてみてもよい．

定理3.1 (リニア c-タプルの存在の必要条件)
D を依存性とする．s →∞ としたとき，
|∪ _{i=0 to s} Dⁱ| / s →∞
ならば，リニア c-タプルは存在しない．
```
[Proof]
  この依存性 D にリニア c-タプル ({α}, T) が存在したとする．
  |T| = B とするとき，s ≥ 0 に対して，
      D^s ⊆ ∪_{i = 0 to B・s}(T・αⁱ)
  が s に関する帰納法で証明することができる．

  したがって，D にリニア c-タプルがあれば，
      ∪ _{i=0 to s} Dⁱ ⊆ ∪_{i = 0 to B・s}(T・αⁱ)
  となりる．右辺の集合のサイズは，高々 |T|・s・B にしかならないので，
  ∪ _{i=0 to s} Dⁱ は，高々，s に対して線形でしか大きくならない．
[Q.E.D.]
```
例えば，n 個の中から m 個を取り出す組み合わせの数 C(n, m) は次の漸化式で表される．
```
    C(n, m) = C(n-1, m-1) + C(n-1, m)    if 0 < m and m < n
            = 1                          otherwise
```
この依存性は D = {λ(n, m).(n-1, m-1), λ(n, m).(n-1, m)} で |∪ D^s| は，s より大きなオーダーで増えていくので，リニア c-タプルはない．
次の定理は一見複雑な依存性を，より簡単な依存性に簡約化して c-タプルを探すことを可能にする．
定理3.2 (Mが直積に分解できる場合の簡略化)
D を依存性とし，M を考察している関数空間のモノイドとする．さらに，M がある有限モノイド F とモノイド M' の直積 F × M' として表せるとする．つまり，
```
    M = M' × F     for a monoid F such that |F| < ∞
```
D の M' 成分を D' とするとき．もし D' に c-タプル (A', T') があるなら，
(A' × {id}, T' × F) は，D の c-タプルである．
ただし，二つモノイド M' と F の直積 M' × F は，集合としての直積 M' × F に次の演算を定義したモノイドとする．
```
   (x1, y2)・(x2, y2) := (x1・y1, x2・y2)
                                for (x1, y1), (x2, y2) ∈ M'×F
```
また，D ⊆ M' × F の M' 成分 D' は，次の依存性とする．
```
   D' := {x | (x, y) ∈ M' × F}
```
```
[Proof]
  M' をモノイド，F を有限モノイドとし，
    M = M' × F = {(a, b) | a ∈ M', b ∈ F}
    (a1, b1)・(a2, b2) = (a1・a2, b1・ b2)
  とする．
  (A', T') が D' = {σ | (σ, b) ∈ D} の c-タプルとするとき，
    (A' × {id}, T' × F) 
  は D の c-タプルであることを示す．

  まず，id ∈ A' だから，(id, id) ∈ A' × {id}．

  次に，(σ, b) ∈ T' × F とする．
     σ ∈ T'A' の場合は，(σ, b) ∈ (T' × F)・(A' × {id})
     D'σ ⊆ T'A' の場合は，D(σ, b) ⊆ (T' × F)・(A' × {id})
  となり，条件２も満たす．

  最後に，s > 0 に対して，A'^s が id を含まないので，(A' × {id})^s も
  (id, id) を含まない．
[Q.E.D.]
```
この定理は，依存性から c-タプルを探すとき，その依存性の有限モノイドの直積成分は取り去って考えて構わないことを示している．例えば，ハノイの塔のプログラム
```
  hanoi(n, a, b, c) <= if n = 0 then nil
                       else hanoi(n-1, a, c, b) + 
                            [["Move disk", n, "from", a, "to", b]] +
                            hanoi(n-1, c, b, a)
      ここで，"+" は配列を連結する演算子として使っている
```
の例では，依存性は，
```
    D={λ(n, a, b, c).(n-1, a, c, b), λ(n, a, b, c). (n-1, c, b, a)}
```
であり，この後ろの方３つのパラメータ a, b, c の部分は，3つのものを入れ替える対称群と同型である．３つの場所 a, b, c を入れ替える関数のなす群を S₃ と表すことにすると，考察している関数空間のモノイド M は，Z × S₃と同型である（この場合は全部逆元を持つので群でもある）． |S₃| = 6 < ∞ であるから，この定理が適用できる． D の S₃に関する商をとった依存性（つまり，D から，a, b, c の部分を除いた依存性）
```
      D'={λn.(n-1)}
```
は，あたりまえの c-タプル (A, T) = ({λn.(n-1)}, {id}) を持つので，ハノイの塔にも c-タプル
```
      ({λn.(n-1)} × {id}, {id} × S₃)
```
がある．要は，a, b, c ３つの場所のすべての入れ替えについてハノイの塔の解を求める関数を定義すると，毎回の計算は，一つ円盤を少なくしたハノイの塔の解から作ることができるということである．本ページの前半では６つではなく３つの組からなるタプルでプログラム変換を行っている．この方法は後で述べるが，この定理は，とにかく，原理的には有限モノイドの因子を取り除くことができることを表している．
次の定理はリニア c-タプルが存在する十分条件であり，ある場合における，定理3.1（リニア c-タプルが存在する必要条件）の逆の定理である．その場合とは，M が有限生成のアーベル群（可換群）である場合である．
定理3.3 (リニア c-タプルの存在の十分条件)
考察している関数空間のモノイド M が可換群であるとする（もともと，モノイドというところまでしか要求していなが，ここではたまたま可換群までの条件を満たしていたとする）．依存性 D が
```
            |∪ Dⁿ|/n が有界
```
なら，D にはあるα∈Mに対して，リニア c-タプル ({α}, T) が存在する．
```
[Proof 概略]
```
これが成立することの概要を説明しておく．依存性 D を含む最小の M が（有限生成の）可換群なら，これは整数のなす群 Zいくつかと，有限可換群の直積であらわされる．上の式が有界になるためには，整数の群 Z の成分は高々１つしかない．したがって，M は F × Z ここで F はある有限可換群という形に書き表される．この関数の空間にはリニア c-タプルがある．
```
[Q.E.D.]
```
次の定理は，このページでハノイの塔のプログラムを，３項組を使い変換するのに使った定理である．
定理3.4 (|Dⁿ| が有界の場合)
依存性 D が
1. 逆元を M=[D] の中に持つ要素 α ∈ D が存在する．すなわち，ある α^-1 ∈ M が存在して，
  α・α^-1 = α^-1・α = id
  また，α^s は s>0 に対して id にはならないとする．
2. |Dⁿ| が有界（つまり有限）
の２つの条件を満たすなら， ({α}, D^sα^-s) はD のリニア c-タプルである．ここで s は |D^s| を最大にする 0 以上の整数である（実は，α ∈ D は逆元を持つので，αを後ろから掛ける変換は 1:1 対応となるため， |D^s+1| ≥ |D^s・α| = |D^s| となるが，一方 |D^s| の最大性により， D^s 以降は，それらの要素数は一定である）．
```
[Proof]
  |D^s+1| = |D^s| とし，α ∈ D は逆元 α^-1 ∈ M を持つとする．
  D^sα ⊆ D^s+1 だが，これらは要素数が等しいので
    D^sα = D^s+1
  である．したがって，任意の σ ∈ T = D^sα^-s に対して，
    Dσ ⊆ DT = D(D^sα^-s) =(D^s+1α^-s = D^sαα^-s = (D^sα^-s)α = Tα
  これは，c-タプルの条件の２番目 Dσ ∈ TA を満たす．

  また，α^s ∈ D^s だから，id = α^s・α^-s ∈ D^sα^-s = T となり，
  一番目の条件も満たしている．
  α^s は s>0 に対して id にはならないので３番目の条件も満たしている．
[Q.E.D.]
```
本ページの本文の方で使ったハノイの塔のタプルは，この定理を使って求めている．ハノイの塔の依存性は，
```
      D={λ(n, a, b, c).(n-1, a, c, b), λ(n, a, b, c). (n-1, c, b, a)}
```
だが，この依存性のべき乗 D^s は３以上に増えない．
```
        |D| = 2, |D²|=3, |D³|=3, ...
```
である．したがって，λ(n, a, b, c).(n-1, a, c, b) をσと書いたとき，リニア c-タプル
```
      （{σ}, D²・σ^-2) =
       ({λ(n, a, b, c).(n-1, a, c, b)}, {λ(n, a, b, c).(n, a, b, c)=id,
                                          λ(n, a, b, c).(n, b, c, a),
                                          λ(n, a, b, c).(n, c, a, b)})
```
を使ってリニアな再帰定義
```
    hanoi(n, a, b, c) <= u  where [u, v, w] = hanoi_triple(n, a, b, c)
    hanoi_triple(n, a, b, c) <=
        if n = 0 then [nil, nil, nil]
        else
          [u + [["Move disk", n, "from", a, "to", b]] + v,
           w + [["Move disk", n, "from", b, "to", c]] + u,
           v + [["Move disk", n, "from", c, "to", a]] + w]
             where [u, v, w] = hanoi_triple(n-1, a, c, b)
        end
```
に変換できる．
定理3.5 (Dの生成元の個数以内の再帰呼び出しで抑える)
考察している関数空間のモノイド M の部分集合 B ⊆ M があって， D ⊆ [B] (つまり，D が B で生成されるモノイド [B] に入っている) が成立し， s > 0 に対して B^s が id を含まないなら，D は (B, T) の形の c-タプルを持つ．ここで，この T は，
```
    T := ∪ _d∈D prefix(d)

          ここで，d = σ₁・...・σ_n σ_i∈B のとき，
            prefix(d) = {id, σ₁, σ₁・σ₂, ..., σ₁・...・σ_n-1}
          とする．つまり，関数を１つずつ右から剥がしていったものを
          集めたものである．
```
で求められるものである．
```
[Proof]
まず，id ∈ prefix(d) for d ∈ D であるから，c-タプルの１番目の条件は満たす．

次に，id 以外の σ &isin T について言えば，T には，σの右側の関数適用を剥がした
関数が入っているので，σ &isin TB となる．また，id についていえば
    D・id = D ⊆ TB
であるから，c-タプルの２番目の条件は見たしている．

３番目の条件は定理の B の条件と一緒である．
[Q.E.D.]
```
この定理の一番簡単な適用対象はフィボナッチ数を求めるプログラムである．そのプログラムの依存性 D は，
```
    D = {σ, σ²} where σ=λn.n-1
```
だから
```
    T = prefix(σ) ∪ prefix(σ²)
      = {id} ∪ {id, σ}
      = {id, σ}
```
となる．したがって，c-タプルは ({σ}, {id, σ}) = ({λn.n-1}, {id, λn.n-1}) で，
```
  fib_pair(n) = [fib(n), fib(n-1)]
```
という補助関数を定義し，これを fib_pair(σ(n)) = fib_pair(n-1) を参照する再帰関数に書き直せばよいことがわかる．
生成元の集合 B が２個以上の場合も例を載せておく．
例：
```
  f(x) <= if P(x) then h(x)
          else
            list(f(car(cdr(cdr(x))), f(car(car(car(x))), f(cdr(cdr(x))))
          end
　　ここで，P(x), h(x), car(x), cdr(x) は何らかの既知関数とする．
```
この依存性は
```
  D = {λx.car(cdr(cdr(x))), λx.car(car(car(x))), λx.cdr(cdr(x))}
```
c-タプルは
```
  T = prefix(car・cdr・cdr) ∪ prefix(car・car・car) ∪ prefix(cdr・cdr)}
    = {id, car, car・cdr} ∪ {id, car, car・car} ∪ {id, cdr}
    = {id, car, cdr, car・cdr, car・car}
  A = {car, cdr}
```
である．もともと，３つの再帰呼び出しを持っていた関数定義だが，同時にいくつかの引数に対して計算を行うことにより，２つの再帰呼び出しだけですむようになっている．
生成元の集合 B が２個以上の場合は，B が１個の集合である fib の場合ほど効果はない．もちろん，３つの再帰呼び出しを持つ再帰関数が，２個の再帰呼び出しに抑えられればそれなりの効果はあるが，やはり指数関数的に計算量が増えてしまうので，５０歩１００歩の感は否めない．
（実はもう一つ定理があって，論文の構成上はそれが主定理なのだが，面倒なのと本当に使いでがあるかどうか，いまいち自信がないので，元気がでたら書くことにする．
2018年 7 月 16 日（月））
プログラムの書き換えについて
(The transformation of the programs usign tuples)
ここでは，c-タプルが見つかったときの，もとのプログラムの書き換え方法について少し具体的に述べる．
もとのプログラムは次のような形をしているとする．
```
  f(x) <= if P(x) then a(x) else Φ(f(σ₁(x)), ..., f(σ_s(x))) end
```
書き換えの時に停止性の問題が発生するので，ここでは，最初の大雑把な定式化より一段階詳細にして，再帰呼び出しを行わない部分を明示的に書いている．この依存性は
```
    D = {σ₁, ..., σ_s}
```
である．これに対して，c-タプル
```
    A = {α₁, ..., α_m}
    T = {τ₁, ..., τ_n}
```
が見つかったとする．このときのプログラムの書き換えでは，補助関数 h(x) は
```
    h(x) = [f(τ₁(x), ..., τ_n(x)]
```
を意図する関数を導入する．τ_i = id とすれば，元の関数 f(x) は
```
    f(x) = u_i where [u₁, ..., u_i, ..., u_n] = h(x)
```
と書き換えられる．あとは，h(x) を自分自身を参照する再帰関数に書き換えるだけである．

h(x) の記述方法は大まかに言って２つの方法がある．一つは人間が書いたり，読んだりするのに向いている形式で，もう一つは特殊な計算機構を仮定することにより，機械的に書き換える方法である．まず，人間向きの形式に書き換える方法から述べる．それには補助関数 h(x) を次のように定義する．
```
書き換え方法１（人間による書き換えに向いている）

    h(x) <= if P'(x) then [t₁(x), ..., t_n(x)]
            else [ψ₁(u₁, ..., u_m), ..., ψ_n(u₁, ..., u_m))
              where u₁ = h(α₁(x))
                       ...
                    u_m = h(α_m(x))
            end
```
ここで，P'(x) は再帰を止めるための条件である．もともとの P(x) から変化しているのは今回は f(x) を計算するためだけでなく，タプルに対して止める必要があるからである． t₁(x), ..., t_m(x) は，その時の h(x) のタプルの各要素を計算するための何らかの式である．これらは定義式を見ながら人間が「うーん」と考える．ψ_i(u₁, ..., u_m) は，u₁, ..., u_m を使った式であるが，これはτ_iがT·Aに含まれている場合は，どれかの u_jの要素，そうでないときは，u₁, ..., u_m の要素を Φで組み合わせた式である．厳密に書くと次のようになる．
```
  Ψ_i = u_j[k]           τ_i∈T·A の場合
           ここで j, k は次を満たす添え字とする τ_i = τ_j·α_k∈T·A

      = Φ(v₁, ..., v_s) その他の場合
           ここで v_j = u_k[l] ただし σ_j·τ_i = τ_k·α_l
```
この例としてはすでに一度出てきたが，フィボナッチ関数の例が典型的である．fib(n) の元の定義は
```
 fib(n) <= if (n=0 or n=1) then 1 else fib(n-1) + fib(n-2) end  (*)
```
であり，この依存性 D = {λn.n-1, λn.n-2} には c-タプル
(A, T) = ({λn.n-1}, {id, λn.n-1})
があるので，補助関数を
fib_pair(n) = [fib(n), fib(n-1)]
とおき，次のように書き換えることができる．
```
   fib(n) <= u where [u, v] = fib_pair(n)
   fib_pair(n) <= if (n = 0 or n = 1) then [1, 1]
                  else
                    [u+v, u] where [u, v] = fib_pair(n-1)
                  end
```
実はここに少し「ごまかし」がある．
fib_pair(0) = [fib(0), fib(-1)] = [1, 1]
としている部分である．fib(-1) はもともとの定義 (*) では定義されていなかった．それを無理やり１つの if 文の then の部分に入れて，fib(-1) = 1 としているのである．この例からほころびが見つかり，読者は次のような疑問を持つだろう．
疑問A
1. c-タプル (T, A) から作った補助関数 h(x) のタプルの要素の中には， A の中の関数を繰り返し適用すると，もともとの関数定義を実行したのでは現れない関数の組み合わせが発生するのではないか？
2. さらにそのような関数の組み合わせσに対して f(σ(x)) が定義されないどころか， σ(x) さえも定義されない場合があるのではないか？
これはすごくまともな疑問である．実際に上の疑問のような場合が生じる．これには，もう一つの書き換え方法を述べた後にまとめて筆者の考えを述べる．
もう一つ書き換えの方法を書いておく．以下の表記で， Ψ_i は先の書き換え方法１と同様に次のように定義される．
```
  Ψ_i = u_j[k]           τ_i∈T·A の場合
           ここで j, k は次を満たす添え字とする τ_i = τ_j·α_k∈T·A

      = Φ(v₁, ..., v_s) その他の場合
           ここで v_j = u_k[l] ただし σ_j·τ_i = τ_k·α_l
```
この定義のもとに，元のプログラムを次のように書き換える．
```
書き換え方法２（機械的な書き換えに向いている）

    h(x) = [if P(τ₁(x)) then a(τ₁(x)) else Ψ₁ end,
              ...
            if P(τ_n(x)) then a(τ₁(x)) else Ψ_n end]
         where
              where u₁ = h(α₁(x))
                       ...
                    u_m = h(α_m(x))
```
こちらは通常の評価機構では止まらない．
方法１でも方法２でも良いので，f(x) を呼び出したとき，その計算でどのような項が計算されるか，タプルの要素単位で追跡してみよう（図4.1，図4.2 を参照)．実際のプログラムでの追跡でなく，依存性 D, c-タプル (A, T) の要素の形で追跡してみる．
最初，f(x) が呼び出されると， h(x) の中の id ∈ T に対応する項が評価される．(T, A) が c-タプルであることから， D・id = D ⊆ T・A なので，T・A の中の D に対応するf() の値が計算されることになる．この時点では，まだ，もともと呼ばれたはずの f(σ(x)) に対する呼び出ししか参照されていない．次に今参照されたタプルの要素 f(σ(x)) がまだ計算されていないときは， σ が， T・A² にあるか，あるいは，D・σが T・A² にあるかにより，それらに対応する T・A²の関数に対する f() が計算される．毎回，元の関数の評価に必要な分しか参照されないので，帰納法により，もとの定義で計算された f(σ(x)) に対応する値しか参照されないことになる．
方法２は止まらないと言ったが，タプルの要素単位で評価の駆動を掛けることができる遅延評価の機構を持っている実行系では停止し，もともとの定義で評価される f(σ(x)) だけが評価されるはずである．さらに計算効率は，書き直した後では，複数の場所で現れる同じ f(σ(x)) が共有されているので，もとの定義のように組織的に同じ引数に対する呼び出しがおこるということはなくなる．

図4.1 id∈T からの計算の流れ
図4.2 c-タプル (A, T) における T, TA の要素間の関係(図2.1 の再掲)

つまり，結論としては，
1. 方法１では，もとの関数定義で呼び出されないはずのf(σ(x))に対して， σ(x) と f(σ(x)) を（エラーが起こらないように）うまく定義すると，書き直した後の再帰定義では，もともと f(x) が計算できる x に対する呼び出してあるかぎり，元の定義の値と同じ結果になる．
2. 方法２では，タプルの要素単位での遅延評価の機構をもっている言語実行系ではもともと f(x) が計算できる x に対する呼び出してあるかぎり，元の定義の値と同じ結果になる．
ということが言えるはずである．
結論 (Conclusion)
本論文では，タプリング戦略に基づくプログラム変換の自動化のネックになっていた，補助関数の導入の自動化を目指して，モノイドの言葉を使い，補助関数の定義に有効なタプルの候補を見つけ出す問題を定式化した．
もとのプログラムの再帰呼び出しの際に，引数を変化させている関数から生成されるモノイドをM として，M の性質と補助関数導入の候補の関係を論じる．具体的には，もとの再帰呼び出しで引数を変化させていた，関数の集合を「依存性」D として定義し， D に対して，補助関数 T と書き換えられた再帰プログラムで再帰呼び出しのときの引数の変化を指示する関数の集合 A を決める問題を定式化した．
定式化された問題に対して，依存性 D の特徴により，補助関数の候補 (A, T) を見つけ出す方法をいくつかの定理として整理した．
この整理によりハノイの塔の問題などに対して，効果的な補助関数を容易に見つけ出すことができるようになった．
また，見つけた補助関数を用いてプログラム変換する際に，もとのプログラム呼び出しでは扱わなかった引数を変化させる関数を扱う可能性があることを述べ，それに対する対応方法を述べた．
これらにより，タプリング戦略を用いたプログラム変換の補助関数導入が容易になり，モノイドの計算が自動でできるような場合は，自動的な導入が可能になると考える．
もう一つ，計算の重複を避ける方法としては，メモ化により，一度計算した結果を覚えておき，それを再利用するという方法がある．これは，本ページの最初の記事の中でも使って入り，非常に簡単な方法である．ただし，この方法は引数の空間が適当に小さな空間であることが要求される．タプリング戦略を用いたプログラム変換では再帰関数定義の見直しにより，できるだけ同じ引数に対する呼び出しをしないようにするので，そのような大きなメモリー空間は必要ない．その代わり，変換が大変なことと必ずしもすべてを共有できるわけではないというトレードオフがある．
本解説を理解するための数学的定義と諸定理
(Preliminary knowledge in mathematics for this paper)
そのうち書きたいが，本ページの内容を理解するためには次のような概念（定義）と定理を知っておくと良い．2018.07.22 (日)
1. 半群，モノイド，群の定義
  ２つの元 x, y の演算 x・y が定義されている集合 S について
  （S と演算・のペア (S, ・) と書くことも多い），S が
  - ・が結合法則 x・(y・z) = (x・y)・z を満たせば，S を半群
  - さらに単位元 e ∈ S, e・x = x・e = x を満たすものがあれば, S をモノイド
  - さらに，任意の x に対して x^-1・x = x・x^-1 = e となる x^-1があれば，S を群
  という．
2. 群の直積と商群の定義
3. 有限生成アーベル群の基本定理
上記の群に関する定理に関して，半群やモノイドでどのような定理が成り立つか，知っていると本論文の拡張に役出す．それには，
A.J. Cain の半群論のテキストについて
で紹介している
A. J. Cain's "Nine Chapters on the Semigroup Art"
はとても良い教科書である．
元の論文との差
(Differences from the original paper)
ここの解説は参考文献に書いた次の論文を概ね簡単にした内容である．
Akihiko, Koga : On Program Transformation with Tupling Technique, RIMS Symposia on Software Science and Engineering ||, 1983 and 1984: Kyoto, Japan, Lecture Notes in Computer Science 220, 1985, pp. 212-232 数理解析研究所講究録 (1985), 547: 128-155
ここにもとの論文との違いをまとめる．
1. 変換対象のプログラムの違い
  元の論文は，複数の関数記号が許された相互再帰の系を対象にしていたが，ここでは簡単化するために１つの関数記号だけに絞り込んだ．そのため，「依存性」，「c-タプル」などの概念に関数記号を入れる必要がなくなり，記述がかなり簡単になった．そのかわり，例えば次のような関数は直接には扱えなくなった．
```
  fiblist(n) <= if n < 0 then 0 else cons(fib(n), fiblist(n-1)) end
  fib(n) <= if (n < 2) then 1 else fib(n-1) + fib(n-2) end
```
  まあ，関数記号を依存性や c-タプルの中にある関数に付けていくだけである．この例だと，T = {(fiblist, id), (fib, id), (fib, λn.n-1)} のように，タプルにする関数とそのときの引数を決めたものが c-タプルを構成する．
2. 定式化の体系の違い
  ここでは再帰呼び出しの際に引数を変化させる関数の空間はモノイドとしたが，元々の論文では群になることを要求していた．つまり，逆元の存在を要求していたわけである．実用上は，逆元を持つものだけに制限するとかなりたくさんの場合を除外してしまうことになる．当時，私は半群やモノイドの知識がほとんどなかったので，群から広げることができなかったのである．今回は，モノイドにして，逆元が必要な部分だけは，それが存在することを定理の仮定に入れた．
  もう一つ，c-タプルをここでは
  1. id∈T
  2. τ∈T ならば τ∈DT または Dτ∈TA
  3. A^s s > 0 には id は入っていない
  と定義したが，元の論文では，最初の条件を
  1. id∈T または D ⊆ T
  としていた．これは最初から T には id が入っているという少し強い条件で定義を簡略化することにした．
3. 用語の違い
  今回，「c-タプル」と呼んでいるものは，もともとの論文では「閉包（closure）」と呼んでいた．数学で使われる用語の「閉包」とは異なるので，今回は補助関数のタプルの候補という意味で，「c-タプル」と呼ぶことにした．
背景と目的 (Background)
常にという訳ではないが，プログラムを人間に分かりやすく，その問題の定義に近い形で記述した場合にプログラムの実行性能が著しく悪くなることがある．そのような場合，もとの分かりやすい記述から，プログラム変換と呼ばれるプログラムの同値変換の技術を使って，効率的なプログラムに変換する方法が知られている[これらの技術の参考文献については，本ページの本文の参考文献を参照のこと．これは本論文を書いた当時のものなので，現在はさらに多くの検討が行われ，多くの知識が蓄積されている．これらについては，「プログラム変換」というキーワードで検索してほしい]．
例えば，次のようなフィボナッチ数を求める再帰プログラムは人間には分かりやすいが，非常に効率が悪い．
```
 fib(n) <= if (n=0 or n=1) then 1 else fib(n-1) + fib(n-2) end  (1)
```
実際，例えば，fib(5) を計算してみると次の図のような関数の呼び出しが起こり，引数の大きさに対して指数関数的な実行時間がかかってしまう．

図I-1 フィボナッチ数を求める素朴な再帰関数のコールグラフ

この呼び出しグラフをよく見ると，次の図のように，同じ呼び出しが組織的に複数行われることによって非効率性が起こっていることが分かる．例えば，fib(3) の計算は単独でも，また，fib(4) の計算の中でも起こっていて，それぞれの中に含まれる fib(2) の計算もまた，それぞれの中で複数発生している．

図I-2 フィボナッチ数計算における計算の重複

これら同じ計算を共有してやることにより，このプログラムの実行は引数の大きさに線形なものにすることができる．このような最適化としてタプリング戦略によるプログラムの変換が知られている．タプリングとは n-項組を作るということを意味している．
天下り式だが，次のような補助的な関数を考えてみる．
```
    fib_pair(n) = [fib(n), fib(n-1)]                              (2)

        ここで [a, b] は a と b の組を表すものとする．
```
ここで，引数を n-1 にして，fib_pair(n-1) を考えてみると，
```
    fib_pair(n-1) = [fib(n-1), fib(n-2)]                          (3)
```
もとの定義 (1) を使うことにより，
```
    fib(n) = u where [u, v] = fib_pair(n)                         (4)
    fib_pair(n) = if n = 0 or n = 1 then [1, 1]
                  else [u + v, u]
                      where [u, v] = fib_pair(n-1)
                  end

        ここで Exp1(x) where x = Exp2 は，まず，式 Exp2 を計算して，その
	結果を x として，その上で式 Exp1(x) を評価することを表す．
        Exp1(x) の x は，式 Exp1 が変数 x に依存していることを表す意図で
        書いている．
```
のように自分自身を参照するプログラムに書き直すことができる．こちらのプログラムでは計算量は n に線形になる．このプログラムの関数の呼び出し関係を次の図に示す．左側の fib_pair は，fib_pair(n) が fib_pair(n-1) を１つだけ呼んでいるので，これは n に比例した回数しか呼び出されない．右側は，その２項組の中の値の依存関係を示している．こちらは，(1) では，同じ n に対する fib(n) が複数計算されていたのに対して，こちらでは１つに共有されており，これにより，指数関数的な計算量が線形な計算量に効率化されている（注意１）．

図I-3 フィボナッチ数の計算の重複の除去

このようにプログラム変換を用いた効率化では，計算量のオーダーが変化するような劇的な効率化ができることが多いのだが，途中で天下り式に与えた補助関数
```
    fib_pair(n-1) = [fib(n-1), fib(n-2)]                          (3)
```
の定義を人間が与える必要があった．実際，伝統的なプログラム変換の技術の中で，このような補助関数の導入は， EUREKA STEP (発見的なステップ) と呼ばれ，プログラム変換の自動的な適用の障害になるものであった．
本論文では，上に述べた fib(n) のようなタプリング戦略に基づくプログラム変換の EUREKA STEP の自動化を目指す．フィボナッチの例では，補助関数の導入は， fib(n) の計算が，fib(n-1) と fib(n-2) に依存していることで決まって来る．つまり，
n に対する fib を求めるためには n-1 と n-2 に対する fib が求まって入れば良い．

という関係が本質的な部分である．さらにいうなら，これは n-1, n-2 でなくとも，引数を変化させる任意の関数σについてσ(n), σ²(n) に変わっても，同様の変換が可能であることが予想できる．本論文では，この本質的な部分をモノイド（ある場合は群）の言葉を使って定式化し，タプリング戦略に有効な補助関数の導入のための知識を整理する．
本論文の目的はプログラム変換に有効な補助関数の自動的な導入だが，上にのべたように任意のモノイドで定式化してしまうと，語の問題（モノイドの中で成立するすべての等式を自動的に導くアルゴリズムは存在しない）があり，完全な自動化はできない．しかし，語の問題はまったく解けない訳ではなく，ある限定された状況では解ける場合もあるので，このような本論文のように形式的な知識体系として，タプリング戦略の補助関数導入ノウハウを整理することは意味のあることだと考える．

注意１: 実はこの変換には多少ごまかしがあり，正しい同値変換にはなっていない．このことについては本文，特に，「プログラムの書き換えについて」で詳しく述べる．

付録 B. Scheme によるhanoi（高速版等）のプログラムの記述
(Hanoi programs rewritten in 'scheme')

知り合いの KNDH さんのために，ここのプログラムを scheme でも記述しておきます．

私はもともと scheme のプログラムはあまり書いたことが無いうえに，今回書くのは20～30年ぶりくらいなので，scheme プログラムとしてはあまりうまい表現ではないかもしれません．一応，Windows 10 上に， Racket という処理系をインストールして動作を確かめました．以下で実現した関数の意味は次の通りです．

(hanoi n a b c)
普通の再帰的なハノイの塔のプログラムです．(hanoi 3 "A" "B" "C") のように呼び出され，結果として円盤をすべて "A" から "B" へ移すための個々の円盤の移動動作のリストを返します．
(hanoi2 n a b c)
メモ化により，重複計算を除去したハノイの塔のプログラムです．
(hanoi3 n a b c)
タプリング戦略のプログラム変換で重複計算を除去したハノイの塔のプログラムです．
(hanoi4 n a b c)
メモ化の hanoi2 の append 除去版です．
(hanoi5 n a b c)
タプリング戦略のプログラム変換版 hanoi3 の append 除去版です．
以下は上のプログラムをテストするための関数群です．場所 "A" "B" "C" を入れるのが面倒なので，円盤の枚数だけを入れるようになっています．foo の系列は結果を返し，bar の系列は再帰呼び出しの回数だけを返します．n が大きくなると急速に出力が増えますのでせいぜい 5 以内でやってみることをお勧めします．
(foo1 n) ... 普通のハノイの塔
(foo2 n) ... メモ化版
(foo3 n) ... タプリング版
(foo4 n) ... メモ化 + append サボり版
(foo5 n) ... タプリング + append サボり版
以下は，結果を表示せず，再帰呼び出しの回数だけを返します．どの位計算に時間がかかっているかを確かめるための関数です．bar4, bar5 は n に 100 とか 1000 を入れても大丈夫ですが，bar1, bar2, bar3 は，20 位にとどめておいてください．うちの計算機はメモリーを 4GB 積んでいて，そこらあたりから少しずつ動作に時間がかかるようになり，22, 23 では途中で止める必要がありました．計算機によっては，それ以下でも苦しいかもしれませんので，皆さんが使用する計算機に合わせて，過負荷にならないように十分気を付けてください．
(bar1 n) ... 普通のハノイの塔
(bar2 n) ... メモ化版
(bar3 n) ... タプリング版
(bar4 n) ... メモ化 + append サボり版
(bar5 n) ... タプリング + append サボり版

;;; 普通のハノイの塔のプログラム
(define count1 0)

(define (hanoi n a b c)
    (set! count1 0)
    (hanoi1 n a b c))

(define (hanoi1 n a b c)
    (begin
     (set! count1 (+ count1 1))
     (if (= n 0) '()
       (append (hanoi1 (- n 1) a c b)
               (cons
	        (list "Move" n "from" a "to" b)
	        (hanoi1 (- n 1) c b a))))))

;;; メモ化して同じ式を再計算しないようにしたハノイの塔のプログラム
(define data2 '())
(define count2 0)

(define (hanoi2 n a b c)
   (begin
    (set! count2 0)
    (set! data2 '())
    (hanoi2b n a b c)))

(define (hanoi2b n a b c)
    (let ((r (assoc (list n a b c) data2)))
      (set! count2 (+ count2 1))
      (if (pair? r) (cdr r)
	(begin
	 (if (= n 0) (set! r '())
	   (set! r (append (hanoi2b (- n 1) a c b)
			   (cons
			    (list "Move" n "from" a "to" b)
			    (hanoi2b (- n 1) c b a)))))
	 (set! data2 (cons (cons (list n a b c) r) data2))
	 r))))

;;; プログラム変換 (タプリング戦略) で重複計算を除去した
;;; ハノイの塔のプログラム

(define count3 0)

(define (hanoi3 n a b c)
    (begin
     (set! count3 0)
     (car (hanoi3_triple n a b c))))

;;; (hanoi3_triple n a b c) は意味的には
;;;     (list (hanoi n a b c) (hanoi n b c a) (hanoi n c a b))
;;; を返す関数．これを自分を参照する再帰関数に書き直す

(define (hanoi3_triple n a b c)
    (begin
     (set! count3 (+ count3 1))
     (if (= n 0) '(() () ())
       (let ((x (hanoi3_triple (- n 1) a c b)))
	 (list
	  (append (car x)   (cons (list "Move" n "from" a "to" b) (cadr x)))
	  (append (caddr x) (cons (list "Move" n "from" b "to" c) (car x)))
	  (append (cadr x)  (cons (list "Move" n "from" c "to" a) (caddr x)))
         )))))

;;; メモ化して同じ式を再計算しないようにしたハノイの塔のプログラム
;;; さらにリストの append を list で代用
(define data4 '())
(define count4 0)

(define (hanoi4 n a b c)
    (begin
     (set! count4 0)
     (set! data4 '())
     (hanoi4b n a b c)))

(define (hanoi4b n a b c)
    (let ((r (assoc (list n a b c) data4)))
      (set! count4 (+ count4 1))
      (if (pair? r) (cdr r)
	(begin
	 (if (= n 0) (set! r '())
	   (set! r (list (hanoi4b (- n 1) a c b)
			 (list "Move" n "from" a "to" b)
			 (hanoi4b (- n 1) c b a))))
	 (set! data4 (cons (cons (list n a b c) r) data4))
	 r))))


;;; プログラム変換 (タプリング戦略) で重複計算を除去したハノイの塔のプログラム
;;; さらにリストの append を list で代用

(define count5 0)

(define (hanoi5 n a b c)
    (begin
     (set! count5 0)
     (car (hanoi5_triple n a b c))))

;;; (hanoi5_triple n a b c) は意味的には
;;;     (list (hanoi n a b c) (hanoi n b c a) (hanoi n c a b))
;;; を返す関数．これを自分を参照する再帰関数に書き直す

(define (hanoi5_triple n a b c)
    (begin
     (set! count5 (+ count5 1))
     (if (= n 0) '(() () ())
       (let ((x (hanoi5_triple (- n 1) a c b)))
	 (list
	  (list (car x)   (list "Move" n "from" a "to" b) (cadr x))
	  (list (caddr x) (list "Move" n "from" b "to" c) (car x))
	  (list (cadr x)  (list "Move" n "from" c "to" a) (caddr x)))))))

;;; それぞれのハノイの塔のプログラムを走らせるためのプログラム
;;; n に大きな数を与えると巨大な解を表示するので，小さい数だけで
;;; 試して，大きな数に対しては次の barN を使うこと
(define (foo1 n) (hanoi  n "A" "B" "C")) ;;; 普通のハノイの塔
(define (foo2 n) (hanoi2 n "A" "B" "C")) ;;; メモ化版
(define (foo3 n) (hanoi3 n "A" "B" "C")) ;;; タプリング版
(define (foo4 n) (hanoi4 n "A" "B" "C")) ;;; メモ化 + append サボり版
(define (foo5 n) (hanoi5 n "A" "B" "C")) ;;; タプリング + append サボり版

;;; 結果を表示せず再帰呼び出しの回数のみを表示
(define (bar1 n) (begin (hanoi  n "A" "B" "C") count1))
(define (bar2 n) (begin (hanoi2 n "A" "B" "C") count2))
(define (bar3 n) (begin (hanoi3 n "A" "B" "C") count3))
(define (bar4 n) (begin (hanoi4 n "A" "B" "C") count4))
(define (bar5 n) (begin (hanoi5 n "A" "B" "C") count5))

計算機（主にソフトウェア）の話題へ

圏論を勉強しようへ
 束論を勉強しようへ
 半群論を勉強しようへ
 ホームページトップ(Top of My Homepage)