Кривая законодательства о силе для социальных сетей запросов

https://stackoverflow.com/questions/4610132

25-09-2019
|

Вопрос

Twitter недавно объявлено Что вы можете приблизить ранг любого данного пользователя Twitter с высокой точностью, вводя счетчик последователей в следующей формуле:

exp ($ a + $ b * log (follower_count))

где $ a = 21 и $ b = -1.1

Это, очевидно, намного более эффективно, чем сортировка всего списка пользователей подчищенным количеством подчищений для данного пользователя.

Если у вас есть аналогичные данные, установленные с другого социального сайта, как вы можете получить значения для $ и $ B, чтобы соответствовать этому набору данных? В основном несколько перечня частот распространение которого предполагается, что является энергетическим законом.

Решение

У вас есть следующая модель:

y = exp(a + b.log(x))

который эквивалентно:

log(y) = a + b.log(x)

Поэтому, если вы принимаете журналы вашего набора данных, вы в конечном итоге с линейной моделью, чтобы затем вы могли использовать линейная регрессия определить наилучшие значения значений a а также b.

Однако это все звучит довольно бессмысленно для меня. Кто говорит, что данный сетевой сайт определяет ранг пользователя, используя такие отношения?

Другие советы

Вы можете использовать дополнение Microsoft Excel с именем «Solver». Он включен в Excel, но не всегда устанавливается по умолчанию. Ищите «дополнение» и «Solver» в вашу версию Excel и загрузите ее.

После установки надстройки выполните следующие действия:

Создайте новый лист. В столбце A вы бы поставили идентификатор каждого человека (необязательно)
Столбец B, количество последователей.
Если данные не отсортированы, сортируйте его с помощью столбца B.
На столбце C положить рейтинг (вы знаете, 1, 2, 3 и т. Д.)
Поставьте значение 21 на ячейку D1, а -1.1 при ячейке E1. Это значения Twitter для $ и $ B. Это наши базовые значения. Они, возможно, изменится.
При ячейке D2 поставит формулу, подобную этому: = EXP ($ E $ 1 + $ F $ 1 * Журнал (B2))
Скопируйте формулу при D2 в конце данных.
На ячейке E2 поставьте формулу для сравнения фактического ранжирования с результатом формулы (т. Е. Дисперсия). Например, = SQRT (C2 * C2 + D2 * D2). Чем ближе являются фактическими и прогнозируемыми значениями, значение будет иметь тенденцию к 0.
Скопируйте ячейку E2 до конца данных.
Внизу данных, в столбце E, суммируйте отклонения. Например, давайте скажем, ваши данные имеют 10 000 значений. На Cell E10001 Enter = Sum (E2: E10000).
Перейдите в данные меню и ищите местоположение меню «Solver». Расположение может очень в зависимости от вашей версии Excel. Используйте объект «Помощь» для поиска цели.
Следуйте инструкциям (я должен идти сейчас), помогая использовать надстройку Solver. Очевидно, что изменяющиеся клетки являются D1 и E1, и цель состоит в том, чтобы сделать E10001 (сумму отклонений) как можно ближе к нулю.

Лицензировано под: CC-BY-SA с атрибуция

Не связан с StackOverflow