Come calcolare un ginocchio nella trama K-Distance?
-
21-12-2019 - |
Domanda
Voglio implementare qualche tipo di miglioramento dell'algoritmo DBSCAN, in cui l'utente non è necessario inserire i parametri di input (Minpts e EPS).La mia idea è usare la trama K-distanze, ma qual è il metodo migliore per calcolare il "ginocchio" di questa trama?Come contare quando ci sono 2 o più ginocchia sulla trama?
Dove posso trovare il codice sorgente per alcuni miglioramenti DBSCAN, come AutoDbScan, VDBSCan, PDBScan o DBSCan-DLP?Sto cercando qualche base di base, ma da nessuna parte posso trovare un buon aiuto.Forse hai visto da qualche parte dei codici sorgente del campione?
Soluzione
dbscan è già stato migliorato a morte .
In Google Scholar, ha 5361 citazioni, e probabilmente 1000+ di questi "migliorano" Dbscan.E probabilmente una dozzina di questi usano la trama K-Distance.Ma nessuno di questi è usato nella pratica.
Se vuoi continuare questa linea di ricerca, è aggiornato meglio su cosa è stato fatto da allora. In particolare, dare un'occhiata all'ottica che fa completamente il parametro Epsilon (ad eccezione dei motivi di prestazione quando si utilizza indici).
Dai un'occhiata a HDBScan * da uno degli autori originali Dbscan, Joerg Sander.Che probabilmente sarà l'estensione DBScan più importante oltre al suo lavoro su ottica e GDBScan.