有没有办法通过记住子节点来加速递归？

https://stackoverflow.com/questions/23962

09-06-2019
|

题

例如，查看计算fibonacci编号的代码：

fib(int n)
{
    if(n==0 || n==1)
        return 1;
    return fib(n-1) + fib(n-2);
}

此代码的问题在于，对于任何大于 15 的数字（在大多数计算机中），它都会生成堆栈溢出错误。

假设我们正在计算 fib(10)。在这个过程中，假设 fib(5) 被计算了很多次。有没有办法将其存储在内存中以便快速检索，从而提高递归速度？

我正在寻找一种可以用于几乎所有问题的通用技术。

解决方案

是的，你的见解是正确的。这就是所谓的动态规划. 。这通常是常见的内存运行时权衡。

对于 fibo，您甚至不需要缓存所有内容：

编辑]这个问题的作者似乎正在寻找一种常规方法来缓存，而不是计算斐波那契的方法。搜索维基百科或查看其他发帖人的代码以获得这个答案。这些答案在时间和记忆上是线性的。

**这是一个线性时间算法 O(n)，内存中的常数 **

in OCaml:

let rec fibo n = 
    let rec aux = fun
        | 0 -> (1,1)
        | n -> let (cur, prec) = aux (n-1) in (cur+prec, cur)
    let (cur,prec) = aux n in prec;;



in C++:

int fibo(int n) {
    if (n == 0 ) return 1;
    if (n == 1 ) return 1;
    int p = fibo(0);
    int c = fibo(1);
    int buff = 0;
    for (int i=1; i < n; ++i) {
      buff = c;
      c = p+c;
      p = buff;
    };
    return c;
};

这在线性时间内执行。但日志实际上是可能的！Roo 的程序也是线性的，但速度慢得多，并且需要使用内存。

这是对数算法 O(log(n))

现在对于日志时间算法（速度更快），这里有一个方法：如果您知道 u(n)、u(n-1)，则可以通过应用矩阵来计算 u(n+1)、u(n)：

| u(n+1) |  = | 1 1 | | u(n)   |
| u(n)   |    | 1 0 | | u(n-1) |

这样你就有了：

| u(n)    |  = | 1 1 |^(n-1) | u(1) | = | 1 1 |^(n-1) | 1 |
| u(n-1)  |    | 1 0 |       | u(0) |   | 1 0 |       | 1 |

计算矩阵的指数具有对数复杂度。只需递归地实现这个想法：

M^(0)    = Id
M^(2p+1) = (M^2p) * M
M^(2p)   = (M^p) * (M^p)  // of course don't compute M^p twice here.

您也可以将其对角化（并不困难），您将在其特征值中找到黄金数及其共轭，结果将为您提供 u(n) 的精确数学公式。它包含这些特征值的幂，因此复杂性仍然是对数的。

斐波那契函数经常被拿来作为例子来说明动态规划，但正如你所看到的，它并不是真正相关的。

@约翰：我认为这与哈希没有任何关系。

@约翰2：地图有点笼统，你不觉得吗？对于斐波那契数列，所有键都是连续的，因此向量是合适的，再次有更快的方法来计算斐波那契序列，请参阅我的代码示例。

其他提示

这称为记忆化，有一篇关于记忆化的非常好的文章马修·波德维索基这几天发的。它用斐波那契数列来举例说明。并显示了 C# 代码。阅读这里.

如果您使用 C#，并且可以使用后锐利, ，这是您的代码的一个简单的记忆方面：

[Serializable]
public class MemoizeAttribute : PostSharp.Laos.OnMethodBoundaryAspect, IEqualityComparer<Object[]>
{
    private Dictionary<Object[], Object> _Cache;

    public MemoizeAttribute()
    {
        _Cache = new Dictionary<object[], object>(this);
    }

    public override void OnEntry(PostSharp.Laos.MethodExecutionEventArgs eventArgs)
    {
        Object[] arguments = eventArgs.GetReadOnlyArgumentArray();
        if (_Cache.ContainsKey(arguments))
        {
            eventArgs.ReturnValue = _Cache[arguments];
            eventArgs.FlowBehavior = FlowBehavior.Return;
        }
    }

    public override void OnExit(MethodExecutionEventArgs eventArgs)
    {
        if (eventArgs.Exception != null)
            return;

        _Cache[eventArgs.GetReadOnlyArgumentArray()] = eventArgs.ReturnValue;
    }

    #region IEqualityComparer<object[]> Members

    public bool Equals(object[] x, object[] y)
    {
        if (Object.ReferenceEquals(x, y))
            return true;

        if (x == null || y == null)
            return false;

        if (x.Length != y.Length)
            return false;

        for (Int32 index = 0, len = x.Length; index < len; index++)
            if (Comparer.Default.Compare(x[index], y[index]) != 0)
                return false;

        return true;
    }

    public int GetHashCode(object[] obj)
    {
        Int32 hash = 23;

        foreach (Object o in obj)
        {
            hash *= 37;
            if (o != null)
                hash += o.GetHashCode();
        }

        return hash;
    }

    #endregion
}

这是使用它的斐波那契实现示例：

[Memoize]
private Int32 Fibonacci(Int32 n)
{
    if (n <= 1)
        return 1;
    else
        return Fibonacci(n - 2) + Fibonacci(n - 1);
}

C++ 中快速而肮脏的记忆：

任意递归方法 type1 foo(type2 bar) { ... } 很容易被记住 map<type2, type1> M.

// your original method
int fib(int n)
{
    if(n==0 || n==1)
        return 1;
    return fib(n-1) + fib(n-2);
}

// with memoization
map<int, int> M = map<int, int>();
int fib(int n)
{
    if(n==0 || n==1)
        return 1;

    // only compute the value for fib(n) if we haven't before
    if(M.count(n) == 0)
        M[n] = fib(n-1) + fib(n-2);

    return M[n];
}

编辑：@康拉德·鲁道夫
Konrad 指出 std::map 并不是我们可以在这里使用的最快的数据结构。确实如此，一个 vector<something> 应该比 map<int, something> （尽管如果函数递归调用的输入不是像本例那样的连续整数，则可能需要更多内存），但映射通常使用起来很方便。

根据维基百科 Fib(0) 应该为 0，但这并不重要。

这是带有 for 循环的简单 C# 解决方案：

ulong Fib(int n)
{
  ulong fib = 1;  // value of fib(i)
  ulong fib1 = 1; // value of fib(i-1)
  ulong fib2 = 0; // value of fib(i-2)

  for (int i = 0; i < n; i++)
  {
    fib = fib1 + fib2;
    fib2 = fib1;
    fib1 = fib;
  }

  return fib;
}

将递归转换为非常常见的技巧尾递归然后循环。有关更多详细信息，请参阅例如这个演讲（PPT）。

这是什么语言？它不会溢出 c 中的任何内容...另外，您可以尝试在堆上创建查找表，或使用映射

对于这种事情来说，缓存通常是一个好主意。由于斐波那契数是常数，因此您可以在计算后缓存结果。一个快速的 C/伪代码示例

class fibstorage {


    bool has-result(int n) { return fibresults.contains(n); }
    int get-result(int n) { return fibresult.find(n).value; }
    void add-result(int n, int v) { fibresults.add(n,v); }

    map<int, int>   fibresults;

}


fib(int n ) {
    if(n==0 || n==1)
            return 1;

    if (fibstorage.has-result(n)) {
        return fibstorage.get-result(n-1);
    }

    return ( (fibstorage.has-result(n-1) ? fibstorage.get-result(n-1) : fib(n-1) ) +
             (fibstorage.has-result(n-2) ? fibstorage.get-result(n-2) : fib(n-2) )
           );
}


calcfib(n) {
    v = fib(n);
    fibstorage.add-result(n,v);
}

这会非常慢，因为每次递归都会导致 3 次查找，但是这应该说明了总体思路

这是故意选择的例子吗？（例如。您想要测试的极端情况）

因为它目前是 O(1.6^n)，我只是想确保您只是在寻找处理此问题的一般情况（缓存值等）的答案，而不仅仅是意外编写糟糕的代码：D

看看这个具体案例，您可能会发现以下内容：

var cache = [];
function fib(n) {
    if (n < 2) return 1;
    if (cache.length > n) return cache[n];
    var result = fib(n - 2) + fib(n - 1);
    cache[n] = result;
    return result;
}

在最坏的情况下退化为 O(n) :D

[编辑：* 不等于 + :D ]

[另一个编辑：Haskell 版本（因为我是个受虐狂什么的）

fibs = 1:1:(zipWith (+) fibs (tail fibs))
fib n = fibs !! n

]

尝试使用映射，n 是键，其对应的斐波那契数是值。

@保罗

谢谢（你的）信息。我不知道。来自维基百科链接你提到：

这种储蓄价值的技术已经计算出来称为记忆

是的，我已经看过代码（+1）。:)

@ESRogs：

std::map 查找是氧（日志 n）这使得这里的速度变慢。最好使用向量。

vector<unsigned int> fib_cache;
fib_cache.push_back(1);
fib_cache.push_back(1);

unsigned int fib(unsigned int n) {
    if (fib_cache.size() <= n)
        fib_cache.push_back(fib(n - 1) + fib(n - 2));

    return fib_cache[n];
}

其他人已经很好而准确地回答了您的问题 - 您正在寻找记忆。

编程语言与尾调用优化（主要是函数式语言）可以执行某些递归情况而不会发生堆栈溢出。尽管有一些技巧，但它并不直接适用于您对斐波那契的定义。

你问题的措辞让我想到了一个有趣的想法。通过仅存储堆栈帧的子集并在必要时重建来避免纯递归函数的堆栈溢出。仅在少数情况下真正有用。如果您的算法仅有条件地依赖于上下文而不是返回，和/或您正在优化内存而不是速度。

Mathematica 有一种特别巧妙的记忆方法，它依赖于散列和函数调用使用相同语法的事实：

fib[0] = 1;
fib[1] = 1;
fib[n_] := fib[n] = fib[n-1] + fib[n-2]

就是这样。它立即缓存（记忆） fib[0] 和 fib[1] 并根据需要缓存其余部分。模式匹配函数调用的规则是，它总是在更通用的定义之前使用更具体的定义。

对于 C# 程序员来说，关于递归、部分、柯里化、记忆化等方面的另一个优秀资源是 Wes Dyer 的博客，尽管他已经有一段时间没有发帖了。他很好地解释了记忆，并在这里提供了可靠的代码示例：http://blogs.msdn.com/wesdyer/archive/2007/01/26/function-memoization.aspx

此代码的问题在于，对于任何大于 15 的数字（在大多数计算机中），它都会生成堆栈溢出错误。

真的吗？你用什么电脑？在44处花费了很长时间，但是堆栈并没有溢出。事实上，在堆栈溢出（Fibbonaci(46)）之前，您将获得一个大于整数所能容纳的值（约 40 亿无符号，约 20 亿有符号）。

这将适合你想做的事情（运行速度很快）

class Program
{
    public static readonly Dictionary<int,int> Items = new Dictionary<int,int>();
    static void Main(string[] args)
    {
        Console.WriteLine(Fibbonacci(46).ToString());
        Console.ReadLine();
    }

    public static int Fibbonacci(int number)
    {
        if (number == 1 || number == 0)
        {
            return 1;
        }

        var minus2 = number - 2;
        var minus1 = number - 1;

        if (!Items.ContainsKey(minus2))
        {
            Items.Add(minus2, Fibbonacci(minus2));
        }

        if (!Items.ContainsKey(minus1))
        {
            Items.Add(minus1, Fibbonacci(minus1));
        }

        return (Items[minus2] + Items[minus1]);
    }
}

如果您使用的是具有一流功能的语言（例如Scheme），则可以添加记忆功能而无需更改初始算法：

(define (memoize fn)
  (letrec ((get (lambda (query) '(#f)))
           (set (lambda (query value)
                  (let ((old-get get))
                    (set! get (lambda (q)
                                (if (equal? q query)
                                    (cons #t value)
                                    (old-get q))))))))
    (lambda args
      (let ((val (get args)))
        (if (car val)
            (cdr val)
            (let ((ret (apply fn args)))
              (set args ret)
              ret))))))


(define fib (memoize (lambda (x)
                       (if (< x 2) x
                           (+ (fib (- x 1)) (fib (- x 2)))))))

第一个块提供记忆工具，第二个块是使用该工具的斐波那契序列。现在，它的运行时间为 O(n)（与没有记忆的算法的 O(2^n) 相对）。

笔记：提供的记忆功能使用闭包链来查找以前的调用。在最坏的情况下，这可能是 O(n)。然而，在这种情况下，所需的值始终位于链的顶部，从而确保 O(1) 查找。

正如其他海报所示，记忆化是用内存换取速度的标准方法，这里有一些伪代码来实现任何函数的记忆化（前提是该函数没有副作用）：

初始功能代码：

 function (parameters)
      body (with recursive calls to calculate result)
      return result

这应该转变为

 function (parameters)
      key = serialized parameters to string
      if (cache[key] does not exist)  {
           body (with recursive calls to calculate result)
           cache[key] = result
      }
      return cache[key]

顺便说一下 Perl 有一个记忆为您指定的代码中的任何函数执行此操作的模块。

# Compute Fibonacci numbers
sub fib {
      my $n = shift;
      return $n if $n < 2;
      fib($n-1) + fib($n-2);
}

为了记住这个函数，你所要做的就是启动你的程序

use Memoize;
memoize('fib');
# Rest of the fib function just like the original version.
# Now fib is automagically much faster ;-)

@拉塞夫克：

这太棒了，这正是我在阅读有关记忆化的内容后一直在脑海中思考的内容 高阶 Perl. 。我认为有两件事是有用的补充：

一个可选参数，用于指定用于生成缓存密钥的静态或成员方法。
更改缓存对象的可选方法，以便您可以使用磁盘或数据库支持的缓存。

不确定如何使用属性来做这种事情（或者它们是否可以通过这种实现实现），但我计划尝试找出答案。

（无关：我试图将其作为评论发布，但我没有意识到评论的允许长度如此之短，因此这并不真正适合作为“答案”）

许可以下： CC-BY-SA 和归因

不隶属于 StackOverflow