Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

feat(depute): tags cloud #13

Open
revolunet opened this issue Nov 6, 2022 · 4 comments
Open

feat(depute): tags cloud #13

revolunet opened this issue Nov 6, 2022 · 4 comments
Labels
question Further information is requested

Comments

@revolunet
Copy link

Apparemment ces infos proviennent de solr;

je ne suis pas sur qu'on veuille conserver ce fonctionnement pour la nouvelle version ? ca rejoint le sujet NER/NLP cc @FizBack

Capture d’écran 2022-11-06 à 15 23 40

@revolunet revolunet added the question Further information is requested label Nov 6, 2022
@FizBack
Copy link

FizBack commented Nov 6, 2022

Top, on pourra voir dans le détail dans la phase de design ce qu'on en fait – intuitivement, je trouve que ça serait intéressant de créer / nommer des clusters pour qu'on se retrouve avec un nombre fini (et pertinent) de topics.

Aucune idée de comment solr fonctionne sous le capot mais j'imagine que ça doit sélectionner les mots clefs en fonction de leur fréquence d'apparition comparée à la rareté du mot (TF-IDF)

@RouxRC
Copy link
Member

RouxRC commented Nov 6, 2022

Alors en fait non ça ne vient pas de solr, mais les liens pointent vers la recherche solr
Le tagging est réalisé par une task qui fait du simple TF/IDF sur les CRs de séance en hémicycle et en commission ici : https://github.com/regardscitoyens/nosdeputes.fr/blob/master/lib/task/tagSeanceTask.class.php
C'est stocké dans la base sql dans les tables tag et tagging

@revolunet
Copy link
Author

Ha ok super merci @RouxRC du coup on peut reproduire côté front sans solr

@RouxRC
Copy link
Member

RouxRC commented Nov 6, 2022

normalement oui !

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
question Further information is requested
Projects
None yet
Development

No branches or pull requests

3 participants