Кривая законодательства о силе для социальных сетей запросов

StackOverflow https://stackoverflow.com/questions/4610132

Вопрос

Twitter недавно объявлено Что вы можете приблизить ранг любого данного пользователя Twitter с высокой точностью, вводя счетчик последователей в следующей формуле:

exp ($ a + $ b * log (follower_count))

где $ a = 21 и $ b = -1.1

Это, очевидно, намного более эффективно, чем сортировка всего списка пользователей подчищенным количеством подчищений для данного пользователя.

Если у вас есть аналогичные данные, установленные с другого социального сайта, как вы можете получить значения для $ и $ B, чтобы соответствовать этому набору данных? В основном несколько перечня частот распространение которого предполагается, что является энергетическим законом.

Это было полезно?

Решение

У вас есть следующая модель:

y = exp(a + b.log(x))

который эквивалентно:

log(y) = a + b.log(x)

Поэтому, если вы принимаете журналы вашего набора данных, вы в конечном итоге с линейной моделью, чтобы затем вы могли использовать линейная регрессия определить наилучшие значения значений a а также b.

Однако это все звучит довольно бессмысленно для меня. Кто говорит, что данный сетевой сайт определяет ранг пользователя, используя такие отношения?

Другие советы

Вы можете использовать дополнение Microsoft Excel с именем «Solver». Он включен в Excel, но не всегда устанавливается по умолчанию. Ищите «дополнение» и «Solver» в вашу версию Excel и загрузите ее.

После установки надстройки выполните следующие действия:

  1. Создайте новый лист. В столбце A вы бы поставили идентификатор каждого человека (необязательно)

  2. Столбец B, количество последователей.

  3. Если данные не отсортированы, сортируйте его с помощью столбца B.

  4. На столбце C положить рейтинг (вы знаете, 1, 2, 3 и т. Д.)

  5. Поставьте значение 21 на ячейку D1, а -1.1 при ячейке E1. Это значения Twitter для $ и $ B. Это наши базовые значения. Они, возможно, изменится.

  6. При ячейке D2 поставит формулу, подобную этому: = EXP ($ E $ 1 + $ F $ 1 * Журнал (B2))

  7. Скопируйте формулу при D2 в конце данных.

  8. На ячейке E2 поставьте формулу для сравнения фактического ранжирования с результатом формулы (т. Е. Дисперсия). Например, = SQRT (C2 * C2 + D2 * D2). Чем ближе являются фактическими и прогнозируемыми значениями, значение будет иметь тенденцию к 0.

  9. Скопируйте ячейку E2 до конца данных.

  10. Внизу данных, в столбце E, суммируйте отклонения. Например, давайте скажем, ваши данные имеют 10 000 значений. На Cell E10001 Enter = Sum (E2: E10000).

  11. Перейдите в данные меню и ищите местоположение меню «Solver». Расположение может очень в зависимости от вашей версии Excel. Используйте объект «Помощь» для поиска цели.

  12. Следуйте инструкциям (я должен идти сейчас), помогая использовать надстройку Solver. Очевидно, что изменяющиеся клетки являются D1 и E1, и цель состоит в том, чтобы сделать E10001 (сумму отклонений) как можно ближе к нулю.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top