Вероятность выбора определенного набора, путем выборки без замены из категориального распределения

cs.stackexchange https://cs.stackexchange.com/questions/120431

  •  29-09-2020
  •  | 
  •  

Вопрос

Предположим, у меня есть категориальное распределение на элементах 1 $, \ dots, n $ , который назначает вероятность $ P_I $ < / span> для элемента $ i $ . Теперь я неоднократно образец от этого распределения, пока я не получит $ K $ Уникальные объекты. Я хотел бы вычислить вероятность того, что набор полученных объектов имеет ровно $ \ {1, \ dots, k \} $ .

Есть ли эффективный способ вычислительно вычисления этой вероятности, учитывая $ p_1, \ dots, p_n $ и $ K $ ?

Я вижу, что вероятность имеет форму

$$ p=sum_ \ sigma \ prod_ {i= 1} ^ k {p _ {\ sigma (i)} \ over (1-p _ {\ sigma (1 )}) \ CDOTS (1-P _ {\ Sigma (1)} - \ dots-p _ {\ sigma (i-1)})}, $$ Там, где сумма превышает все перестановки $ \ sigma \ in s_k $ на $ \ {1, \ dots, k \} $ . (Здесь $ \ SIGMA $ представляет собой порядок, в котором выбраны элементы $ 1, \ dots, k $ ,) Тем не менее, эта формула для вероятности включает в себя $ k! $ термины, поэтому вычисления вероятности таким образом потребуется время экспоненциала в $ k $ . Есть ли более эффективный способ вычислить это?

Конечно, без потери общности мы можем предположить $ n= K + 1 $ .

Это было полезно?

Решение

Для каждого $ \ sigma \ subsEteq [k + 1] $ , вы можете вычислить вероятность $ q (\Sigma) $ что первый $ | \ sigma | $ elements, чтобы появиться, $ \ sigma $ Использование следующих рецидивов: $ q (\ emptyset)= 1 $ а когда $ \ sigma \ neq \ pureds, $$ q (\ sigma)=sum _ {\ sigma \ in \ sigma} q (\ sigma- \ sigma) \ frac {p_ \ sigma} {p_ \ sigma + \ sum _ {\ tau \ notin \ sigma} p_ \ tau}Отказ $$ Вы заинтересованы в $ q ([k]) $ .Общее время вычислений составляет $ O (K2 ^ k) $ (игнорирование арифметики), если вы вычислите сумму в знаменателе в тандеме.Возможно, это может быть улучшено до $ o (2 ^ k) $ .

Лицензировано под: CC-BY-SA с атрибуция
Не связан с cs.stackexchange
scroll top