-
Notifications
You must be signed in to change notification settings - Fork 0
/
taux_rang.py
30 lines (20 loc) · 901 Bytes
/
taux_rang.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
import pandas as pd
import matplotlib.pyplot as plt
import squarify
# Lecture du fichier TSV et extraction des colonnes pertinentes
df = pd.read_csv("taxonkit_rnaspades.tsv", sep="\t")
df["rank_category"] = df["rank"].apply(lambda x: "Virus" if x == "Viruses" else ("Eucaryotes" if x == "Eukaryota" else "Others"))
# Calcul des pourcentages pour chaque catégorie de rang
percentages = df["rank_category"].value_counts(normalize=True) * 100
# Couleurs dégradées du rose
colors = ["#800020", "#B22222", "#DC143C"]
# Création du diagramme à secteurs carré
fig, ax = plt.subplots()
ax.axis('off')
squarify.plot(sizes=percentages, label=percentages.index, color=colors, alpha=0.8)
# Ajout du titre
plt.title("Catégories de rang obtenues avec RnaSpades")
# Sauvegarde de l'image du résultat
plt.savefig('b.png')
plt.close()
print("L'image du camembert a été sauvegardée dans 'b.png'.")