Исследования в алгоритмах случайных лесов, способные переключать наборы данных

https://datascience.stackexchange.com/questions/9560

16-10-2019
|

Вопрос

Мне любопытно, было ли проведено исследование в случайные леса, которые объединяются без присмотра с контролируемым обучением таким образом, позволяя одному алгоритму находить закономерности и работать с несколькими различными наборами данных. Я погуглил каждый возможный способ найти исследование по этому поводу, и я пришел пустым. Может кто-то указать мне верное направление?

Решение

Полуопервизированное обучение

Сочетание неконтролируемого обучения и контролируемого обучения называется как semi-supervised learning, которая, я полагаю, это концепция, которую вы ищете.

Label propagation часто цитируется при изложении эвристики semi-supervised learning. Анкет Суть состоит в том, чтобы использовать кластеризацию, но использовать крошечный набор известных случаев, чтобы получить (или пропадать) метки кластеров. Следовательно, человек может использовать небольшой набор меченных случаев для классификации гораздо большего набора данных неконтролируемых.

Вот некоторые ссылки:

Википедия имеет запись на semi-supervised learning.
Руководство пользователя Scikit Learn часто является полезной отправной точкой и имеет процедуру пропадения метки.
На самом деле есть документы, лечащие semi-supervised random forest модели.
Еще один здесь

Надеюсь это поможет!

Лицензировано под: CC-BY-SA с атрибуция

Не связан с datascience.stackexchange