diff --git a/clustering/mesures_clustering.py b/clustering/mesures_clustering.py new file mode 100644 index 0000000000000000000000000000000000000000..ed08e4befdb9b20760844cb36df36d32cc08f1a2 --- /dev/null +++ b/clustering/mesures_clustering.py @@ -0,0 +1,14 @@ +def compute_silhouette_scores(reduced_embeddings, clustering_results): + """ + Calcule les scores de silhouette pour différents nombres de clusters. + + :param reduced_embeddings: Matrice des embeddings réduits + :param clustering_results: Dictionnaire contenant les labels prédits pour chaque nombre de clusters + :return: Dictionnaire des scores de silhouette + """ + silhouette_scores = {} + for n_clusters, labels in clustering_results.items(): + silhouette_avg = silhouette_score(reduced_embeddings, labels) + silhouette_scores[n_clusters] = silhouette_avg + print(f"Nombre de clusters: {n_clusters}, Silhouette Score: {silhouette_avg:.2f}") + return silhouette_scores \ No newline at end of file