Domanda

Voglio implementare qualche tipo di miglioramento dell'algoritmo DBSCAN, in cui l'utente non è necessario inserire i parametri di input (Minpts e EPS).La mia idea è usare la trama K-distanze, ma qual è il metodo migliore per calcolare il "ginocchio" di questa trama?Come contare quando ci sono 2 o più ginocchia sulla trama?

Dove posso trovare il codice sorgente per alcuni miglioramenti DBSCAN, come AutoDbScan, VDBSCan, PDBScan o DBSCan-DLP?Sto cercando qualche base di base, ma da nessuna parte posso trovare un buon aiuto.Forse hai visto da qualche parte dei codici sorgente del campione?

È stato utile?

Soluzione

dbscan è già stato migliorato a morte .

In Google Scholar, ha 5361 citazioni, e probabilmente 1000+ di questi "migliorano" Dbscan.E probabilmente una dozzina di questi usano la trama K-Distance.Ma nessuno di questi è usato nella pratica.

Se vuoi continuare questa linea di ricerca, è aggiornato meglio su cosa è stato fatto da allora. In particolare, dare un'occhiata all'ottica che fa completamente il parametro Epsilon (ad eccezione dei motivi di prestazione quando si utilizza indici).

Dai un'occhiata a HDBScan * da uno degli autori originali Dbscan, Joerg Sander.Che probabilmente sarà l'estensione DBScan più importante oltre al suo lavoro su ottica e GDBScan.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top