什么是最有效的方式找到所有的因素的数蟒蛇?

https://stackoverflow.com/questions/6800193

22-10-2019
|

题

可以有人向我解释一个有效的方式找到所有的因素的数Python(2.7)?

我可以创造一种算法，要做到这一点，但我认为它是编码不佳和需要很长时间才能产生结果用于一个大的数字。

解决方案

from functools import reduce

def factors(n):    
    return set(reduce(list.__add__, 
                ([i, n//i] for i in range(1, int(n**0.5) + 1) if n % i == 0)))

这将非常迅速地返回一个数字的所有因素 n.

为什么平方根作为上限？

sqrt(x) * sqrt(x) = x. 。因此，如果两个因素相同，则它们都是平方根。如果您使一个因素更大，则必须使另一个因素较小。这意味着两者中的一个始终小于或等于 sqrt(x), ，因此您只需要搜索到那个点即可找到两个匹配因素之一。然后您可以使用 x / fac1 要得到 fac2.

这 reduce(list.__add__, ...) 正在列出 [fac1, fac2] 并将它们加入一个长列表中。

这 [i, n/i] for i in range(1, int(sqrt(n)) + 1) if n % i == 0 如果您分裂的剩余时间，则返回一对因素 n 较小的一个为零（它也不需要检查较大的一个；它只是通过除以来得到 n 较小的。）

这 set(...) 外面摆脱了重复项，这只会出现完美的正方形。为了 n = 4, ，这将返回 2 两次，所以 set 摆脱其中之一。

其他提示

@AGF提出的解决方案很棒，但是一个任意的运行时间可以达到约50％ 奇怪的 通过检查均等的数字。由于奇数的因素总是奇怪的，因此在处理奇数时不必检查这些因素。

我刚刚开始解决 Euler项目我自己拼图。在某些问题中，在两个嵌套的内部调用除数检查 for 循环，此功能的性能至关重要。

将这个事实与AGF的出色解决方案相结合，我最终得到了此功能：

from math import sqrt
def factors(n):
        step = 2 if n%2 else 1
        return set(reduce(list.__add__,
                    ([i, n//i] for i in range(1, int(sqrt(n))+1, step) if n % i == 0)))

但是，在少数数字（〜<100）上，此更改的额外开销可能会导致该功能需要更长的时间。

我进行了一些测试以检查速度。以下是使用的代码。为了产生不同的图，我改变了 X = range(1,100,1) 因此。

import timeit
from math import sqrt
from matplotlib.pyplot import plot, legend, show

def factors_1(n):
    step = 2 if n%2 else 1
    return set(reduce(list.__add__,
                ([i, n//i] for i in range(1, int(sqrt(n))+1, step) if n % i == 0)))

def factors_2(n):
    return set(reduce(list.__add__,
                ([i, n//i] for i in range(1, int(sqrt(n)) + 1) if n % i == 0)))

X = range(1,100000,1000)
Y = []
for i in X:
    f_1 = timeit.timeit('factors_1({})'.format(i), setup='from __main__ import factors_1', number=10000)
    f_2 = timeit.timeit('factors_2({})'.format(i), setup='from __main__ import factors_2', number=10000)
    Y.append(f_1/f_2)
plot(X,Y, label='Running time with/without parity check')
legend()
show()

x =范围（1,100,1） X = range(1,100,1)

这里没有显着差异，但是有了更大的优势，显而易见的是：

x =范围（1,100000,1000）（仅奇数） X = range(1,100000,1000) (only odd numbers)

x =范围（2,100000,100）（仅数字） X = range(2,100000,100) (only even numbers)

x =范围（1,100000,1001）（交替的奇偶校验） X = range(1,100000,1001) (alternating parity)

agf的回答是真的很酷的。我想看看如果我可以改写，以避免使用 reduce().这是我想出了：

import itertools
flatten_iter = itertools.chain.from_iterable
def factors(n):
    return set(flatten_iter((i, n//i) 
                for i in range(1, int(n**0.5)+1) if n % i == 0))

我也尝试了一个版本使用的棘手发电机的功能：

def factors(n):
    return set(x for tup in ([i, n//i] 
                for i in range(1, int(n**0.5)+1) if n % i == 0) for x in tup)

我计时通过计算：

start = 10000000
end = start + 40000
for n in range(start, end):
    factors(n)

我跑了一次让Python汇编，然后它跑下的时间(1)命令的三倍，并保持最佳的时间。

减少的版本：11.58秒
迭代的版本：11.49秒
棘手的版本：11.12秒

注意迭代的版本是建立一个多元组和通过它向flatten_iter().如果我改变码建立一个清单，相反，它减慢略：

iterools(名单)的版本：11.62秒

我认为棘手的发电机功能的版本的可能快在蟒蛇。但它不是真正的速度远远超过了减少的版本，大约4%的速度更快根据我的测量。

AGF答案的另一种方法：

def factors(n):    
    result = set()
    for i in range(1, int(n ** 0.5) + 1):
        div, mod = divmod(n, i)
        if mod == 0:
            result |= {i, div}
    return result

我尝试了大多数这些出色的答案与TimeIt进行比较，以将它们的效率与我的简单功能进行比较，但我经常看到我的效率优于这里列出的效率。我想我会分享它，看看你们都想到什么。

def factors(n):
    results = set()
    for i in xrange(1, int(math.sqrt(n)) + 1):
        if n % i == 0:
            results.add(i)
            results.add(int(n/i))
    return results

正如它所写的那样，您必须导入数学来测试，但是用n **。5替换Math.sqrt（n）也应该工作。我不会打扰浪费时间检查重复项，因为无论如何都在集合中不存在重复。

进一步改进了AFG＆Eryksun的解决方案。以下代码返回所有因素的分类列表，而不会改变运行时间的渐近复杂性：

    def factors(n):    
        l1, l2 = [], []
        for i in range(1, int(n ** 0.5) + 1):
            q,r = n//i, n%i     # Alter: divmod() fn can be used.
            if r == 0:
                l1.append(i) 
                l2.append(q)    # q's obtained are decreasing.
        if l1[-1] == l2[-1]:    # To avoid duplication of the possible factor sqrt(n)
            l1.pop()
        l2.reverse()
        return l1 + l2

想法：而不是使用list.sort（）函数获取分类列表，该列表具有NLOG（n）复杂性；在L2上使用list.rverse（）的速度要快得多。（这就是Python的制作方式。）l2. refverse（）之后，可以将L2附加到L1上，以获取分类的因素列表。

注意，L1包含一世- 正在增加。 L2包含问- 正在减少。那就是使用上述想法的原因。

这是 @agf解决方案的替代方法，该解决方案以更高的Pythonic风格实现了相同的算法：

def factors(n):
    return set(
        factor for i in range(1, int(n**0.5) + 1) if n % i == 0
        for factor in (i, n//i)
    )

该解决方案在Python 2和Python 3中都起作用，没有进口，并且更具可读性。我尚未测试这种方法的性能，但是渐近地应该是相同的，如果性能是一个严重的问题，那么这两个解决方案都是最佳的。

对于n最多10 ** 16（甚至更多），这是一个快速的纯Python 3.6解决方案，

from itertools import compress

def primes(n):
    """ Returns  a list of primes < n for n > 2 """
    sieve = bytearray([True]) * (n//2)
    for i in range(3,int(n**0.5)+1,2):
        if sieve[i//2]:
            sieve[i*i//2::i] = bytearray((n-i*i-1)//(2*i)+1)
    return [2,*compress(range(3,n,2), sieve[1:])]

def factorization(n):
    """ Returns a list of the prime factorization of n """
    pf = []
    for p in primeslist:
      if p*p > n : break
      count = 0
      while not n % p:
        n //= p
        count += 1
      if count > 0: pf.append((p, count))
    if n > 1: pf.append((n, 1))
    return pf

def divisors(n):
    """ Returns an unsorted list of the divisors of n """
    divs = [1]
    for p, e in factorization(n):
        divs += [x*p**k for k in range(1,e+1) for x in divs]
    return divs

n = 600851475143
primeslist = primes(int(n**0.5)+1) 
print(divisors(n))

Sympy中有一种行业强度算法称为因数:

>>> from sympy import factorint
>>> factorint(2**70 + 3**80) 
{5: 2,
 41: 1,
 101: 1,
 181: 1,
 821: 1,
 1597: 1,
 5393: 1,
 27188665321L: 1,
 41030818561L: 1}

这花了不到一分钟的时间。它在鸡尾酒之间切换。请参阅上面链接的文档。

鉴于所有主要因素，所有其他因素都可以轻松构建。

请注意，即使允许接受的答案运行足够长的时间（即永恒）来考虑上述数字，但对于某些数字，它将失败，例如以下示例。这是由于草率 int(n**0.5). 。例如，当 n = 10000000000000079**2, ，我们有

>>> int(n**0.5)
10000000000000078L

自从 10000000000000079是主要的, ，被公认的答案的算法永远不会找到这个因素。请注意，这不仅仅是一个偏僻的人；对于更大的数字，它将被更多。因此，最好避免使用这种算法中的浮点数。

这是另一个没有减少的替代方案，其性能很好。它用 sum 弄平列表。

def factors(n):
    return set(sum([[i, n//i] for i in xrange(1, int(n**0.5)+1) if not n%i], []))

确保抓住比大于 sqrt(number_to_factor) 对于具有3*3*11和 floor sqrt(99)+1 == 10.

import math

def factor(x):
  if x == 0 or x == 1:
    return None
  res = []
  for i in range(2,int(math.floor(math.sqrt(x)+1))):
    while x % i == 0:
      x /= i
      res.append(i)
  if x != 1: # Unusual numbers
    res.append(x)
  return res

如果您想使用Primes编号来快得多，这是一个示例。这些列表很容易在互联网上找到。我在代码中添加了评论。

# http://primes.utm.edu/lists/small/10000.txt
# First 10000 primes

_PRIMES = (2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 
        31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 
        73, 79, 83, 89, 97, 101, 103, 107, 109, 113, 
        127, 131, 137, 139, 149, 151, 157, 163, 167, 173, 
        179, 181, 191, 193, 197, 199, 211, 223, 227, 229, 
        233, 239, 241, 251, 257, 263, 269, 271, 277, 281, 
        283, 293, 307, 311, 313, 317, 331, 337, 347, 349, 
        353, 359, 367, 373, 379, 383, 389, 397, 401, 409, 
        419, 421, 431, 433, 439, 443, 449, 457, 461, 463, 
        467, 479, 487, 491, 499, 503, 509, 521, 523, 541, 
        547, 557, 563, 569, 571, 577, 587, 593, 599, 601, 
        607, 613, 617, 619, 631, 641, 643, 647, 653, 659, 
        661, 673, 677, 683, 691, 701, 709, 719, 727, 733, 
        739, 743, 751, 757, 761, 769, 773, 787, 797, 809, 
        811, 821, 823, 827, 829, 839, 853, 857, 859, 863, 
        877, 881, 883, 887, 907, 911, 919, 929, 937, 941, 
        947, 953, 967, 971, 977, 983, 991, 997, 1009, 1013, 
# Mising a lot of primes for the purpose of the example
)


from bisect import bisect_left as _bisect_left
from math import sqrt as _sqrt


def get_factors(n):
    assert isinstance(n, int), "n must be an integer."
    assert n > 0, "n must be greather than zero."
    limit = pow(_PRIMES[-1], 2)
    assert n <= limit, "n is greather then the limit of {0}".format(limit)
    result = set((1, n))
    root = int(_sqrt(n))
    primes = [t for t in get_primes_smaller_than(root + 1) if not n % t]
    result.update(primes)  # Add all the primes factors less or equal to root square
    for t in primes:
        result.update(get_factors(n/t))  # Add all the factors associted for the primes by using the same process
    return sorted(result)


def get_primes_smaller_than(n):
    return _PRIMES[:_bisect_left(_PRIMES, n)]

一种可能比此处提出的算法更有效的算法（尤其是如果有小素数的情况 n）。这里的诀窍是 调整限制 每当发现主要因素时，都需要哪个试用部门：

def factors(n):
    '''
    return prime factors and multiplicity of n
    n = p0^e0 * p1^e1 * ... * pk^ek encoded as
    res = [(p0, e0), (p1, e1), ..., (pk, ek)]
    '''

    res = []

    # get rid of all the factors of 2 using bit shifts
    mult = 0
    while not n & 1:
        mult += 1
        n >>= 1
    if mult != 0:
        res.append((2, mult))

    limit = round(sqrt(n))
    test_prime = 3
    while test_prime <= limit:
        mult = 0
        while n % test_prime == 0:
            mult += 1
            n //= test_prime
        if mult != 0:
            res.append((test_prime, mult))
            if n == 1:              # only useful if ek >= 3 (ek: multiplicity
                break               # of the last prime) 
            limit = round(sqrt(n))  # adjust the limit
        test_prime += 2             # will often not be prime...
    if n != 1:
        res.append((n, 1))
    return res

当然，这仍然是审判的部门，没有什么比这更幻想了。因此，其效率仍然非常有限（尤其是对于没有小除数的大数字）。

这是python3;该部门 // 应该是您唯一需要适应Python 2的东西（添加 from __future__ import division).

您的最大因素不超过您的数字，所以，假设

def factors(n):
    factors = []
    for i in range(1, n//2+1):
        if n % i == 0:
            factors.append (i)
    factors.append(n)

    return factors

瞧！

查找数量因素的最简单方法：

def factors(x):
    return [i for i in range(1,x+1) if x%i==0]

使用 set(...) 使代码稍慢一点，并且仅在检查平方根时才真正必要。这是我的版本：

def factors(num):
    if (num == 1 or num == 0):
        return []
    f = [1]
    sq = int(math.sqrt(num))
    for i in range(2, sq):
        if num % i == 0:
            f.append(i)
            f.append(num/i)
    if sq > 1 and num % sq == 0:
        f.append(sq)
        if sq*sq != num:
            f.append(num/sq)
    return f

这 if sq*sq != num: 对于12个数字，正方形根部不是整数，但平方根的地板是一个因素。

请注意，此版本不会返回数字本身，但是如果您想要的话，这是一个简单的修复。输出也没有排序。

我定时运行10000次，在所有数字1-5000的1-200次和100次。它的表现优于我测试过的所有其他版本，包括Dansalmo's，Jason Schorn's，Oxrock's，Agf's，Steveha's和Eryksun的解决方案，尽管Oxrock's是最接近的。

使用以下列表理解的简单的内容，并指出我们不需要测试1和我们试图找到的数字：

def factors(n):
    return [x for x in range(2, n//2+1) if n%x == 0]

关于使用平方根的使用，我们想找到10个因素。 sqrt(10) = 4 所以 range(1, int(sqrt(10))) = [1, 2, 3, 4] 并测试多达4个显然错过了5。

除非我缺少我建议的东西，如果您必须这样做，请使用 int(ceil(sqrt(x))). 。当然，这会产生许多不必要的功能呼叫。

我认为，对于可读性和速度 @Oxrock的解决方案是最好的，因此，这是为Python 3+重写的代码：

def num_factors(n):
    results = set()
    for i in range(1, int(n**0.5) + 1):
        if n % i == 0: results.update([i,int(n/i)])
    return results

当我看到这个问题时，我感到非常惊讶，即使numpy是 更快的速度 比Python循环。通过使用numpy实现 @agf的解决方案，它平均得出 更快8倍。我相信，如果您在numpy中实现了其他一些解决方案，那么您可能会获得美好的时光。

这是我的功能：

import numpy as np
def b(n):
    r = np.arange(1, int(n ** 0.5) + 1)
    x = r[np.mod(n, r) == 0]
    return set(np.concatenate((x, n / x), axis=None))

请注意，X轴的数量不是功能的输入。函数的输入为2至x轴负1的数字1。

import 'dart:math';
generateFactorsOfN(N){
  //determine lowest bound divisor range
  final lowerBoundCheck = sqrt(N).toInt();
  var factors = Set<int>(); //stores factors
  /**
   * Lets take 16:
   * 4 = sqrt(16)
   * start from 1 ...  4 inclusive
   * check mod 16 % 1 == 0?  set[1, (16 / 1)]
   * check mod 16 % 2 == 0?  set[1, (16 / 1) , 2 , (16 / 2)]
   * check mod 16 % 3 == 0?  set[1, (16 / 1) , 2 , (16 / 2)] -> unchanged
   * check mod 16 % 4 == 0?  set[1, (16 / 1) , 2 , (16 / 2), 4, (16 / 4)]
   *
   *  ******************* set is used to remove duplicate
   *  ******************* case 4 and (16 / 4) both equal to 4
   *  return factor set<int>.. this isn't ordered
   */

  for(var divisor = 1; divisor <= lowerBoundCheck; divisor++){
    if(N % divisor == 0){
      factors.add(divisor);
      factors.add(N ~/ divisor); // ~/ integer division 
    }
  }
  return factors;
}

 import math

    '''
    I applied finding prime factorization to solve this. (Trial Division)
    It's not complicated
    '''


    def generate_factors(n):
        lower_bound_check = int(math.sqrt(n))  # determine lowest bound divisor range [16 = 4]
        factors = set()  # store factors
        for divisors in range(1, lower_bound_check + 1):  # loop [1 .. 4]
            if n % divisors == 0:
                factors.add(divisors)  # lower bound divisor is found 16 [ 1, 2, 4]
                factors.add(n // divisors)  # get upper divisor from lower [ 16 / 1 = 16, 16 / 2 = 8, 16 / 4 = 4]
        return factors  # [1, 2, 4, 8 16]


    print(generate_factors(12)) # {1, 2, 3, 4, 6, 12} -> pycharm output

 Pierre Vriens hopefully this makes more sense. this is an O(nlogn) solution.

我认为这是最简单的方法：

    x = 23

    i = 1
    while i <= x:
      if x % i == 0:
        print("factor: %s"% i)
      i += 1

许可以下： CC-BY-SA 和归因

不隶属于 StackOverflow