Question

J'ai deux ensembles de sujets obtenus à partir de deux ensembles différents d'articles de journaux.

En d'autres termes, Cluster_1 = $ {x_1, x_2, ..., x_n} $ inclut les principaux sujets du jeu de documents de presse 'x' et Cluster_2 = $ {y_1, y_2, ..., y_n} $ inclut les sujets principaux du jeu de journaux «y».

Maintenant, je veux trouver des clusters dans les deux ensembles qui sont similaires / liés en considérant les attributs de cluster comme indiqué dans l'exemple ci-dessous.

Example 1,
**X1 in Cluster_1** is mostly similar/related to **Y2 in Cluster_2**
**X2 in Cluster_1** is mostly similar/related to **Yn in cluster_2**
and so on.

Example 2:
News about Yet in Cluster_1 is mostly similar/related to News about Science in Cluster_2
News about Floods in Cluster_1 is mostly similar/related to News about Rains in Cluster_2

Depuis, je fais face à deux ensembles distincts de clusters, quelle serait une mesure / méthode appropriée que je peux utiliser pour connecter les clusters dans les deux ensembles différents?

Pas de solution correcte

Licencié sous: CC-BY-SA avec attribution
scroll top