WikidataSearcher ermöglicht die Abfrage von Wikidata, wie IDs, Label und Alias, und beinhaltet zwei Main-Skripte: DelMain und VocabularyMain.
DelMain erweitert die Datei DEL_reduziert.tsv um eine Spalte für die deutschen Labels Wikidata Label (de), indem diese mithilfe der Wikidata-ID Wikidata Ids (zu DEL-Begriffen) von Wikidata abgefragt werden.
Die erweiterte Tabelle ist die DEL_reduziert_de.tsv.
VocabularyMain sucht die Begriffe der 1. Spalte des Themenvokabulars.tsv auf deren Existenz in Wikidata als Label oder Alias.
Je Thema (1. Spalte), Suche nach Wikidata-Entitäten, die das Thema als
- französisches Label (exakt oder kleingeschrieben) [LABELFRENCH]
- französisches Alias (exakt oder kleingeschrieben) [ALIASFRENCH]
- englisches Label (exakt oder kleingeschrieben) [LABELENGLISH]
- englisches Alias (exakt oder kleingeschrieben) [ALIASENGLISH]
besitzen. Diese vier Strategien werden in der genannten Reihenfolge angewandt. Sobald mindestens eine Entität existiert, wird nicht mehr mit den anderen Strategien nach weiteren Entitäten gesucht.
Bsp.: Bei der Suche für das Thema "Banques" wird keine Entität gefunden, deren franzosisches Label "Banques" ist. Daher wird nach Entitäten gesucht, die den Alias "Banques" besitzen. Hier konnte eine gefunden werden, diese wird in der Ergebnis-Datei notiert und es wird nicht noch nach Entitäten gesucht, deren englisches Label oder Alias "Banques" ist.
Header | Beschreibung |
---|---|
DEL komplett | 1. Spalte Original-Datei |
DEL Schnittmenge | 2. Spalte Original-Datei |
Anzahl der Suchergebnisse | Anzahl der Entitäten, die mit einer Strategie gefunden wurden |
Ergebnisse durch Suche nach | Strategie, mit welcher die Entitäten gefunden wurden. Wurden keine Entitäten gefunden, ist diese Zelle mit NONE beschriftet |
Ergebnisse (IDs) | Array von Wikidata-Entitäten-IDs |
Ergebnisse (URLs) | Array von Wikidata-Entitäten-URLs (passend zu den IDs) |