Kompetenser från Enrichment APIn innehåller dubbletter

Hej!

När man skickar in jobbannonser in i Enrichment APIn så returneras en lista med kompetenser baserat på beskrivningen. Det verkar dock som att ord som framkommer flera gånger i beskrivningen också uppkommer flera gånger i “kompetenslistan”. Ett exempel på detta är en annons från 2017-03-06, Göteborgs Stad eftersöker “Rektor till Torpaskolan”.

I det här fallet returneras följande “competencies”:

“[‘Rektor’, ‘Pedagog’, ‘Rektor’, ‘Rektor’, ‘Områdeschef’, ‘Rektor’, ‘Bas’, ‘Utvecklingsledare’, ‘Hr-specialist’, ‘Verksamhetsutvecklare’, ‘Pedagog’, ‘Ekonom’, ‘Rektor’, ‘Arbetslagsledare’, ‘Arbetslagsledare’, ‘Försäljare’, ‘Förstelärare’, ‘Annonssäljare’]”

Finns det något smidigt sätt att kalla på APIn så att endast unika kompetenser returneras. Tänker att det skulle vara smidigare än att loopa igenom varje “competencies” cell och kolla efter dubbletter (med tanke på att vi använder alla jobbannonser i databasen för vårt projekt).

Mvh
Simon

Hejsan Simon!

Om det är så att du inte får unika kompetenser i svaret från API:et, så beror det på att du använder den endpoint som returnerar identifierade kompetensord plus en prediction, d.v.s. ett decimaltal som indikerar hur sannolikt det är att kompetensen efterfrågas av arbetsgivaren (meriterande eller skallkrav) eller inte. Denna endpoint, https://jobad-enrichments-api.jobtechdev.se/enrichtextdocuments, returnerar med andra ord både kompetenser som efterfrågas och kompetenser som inte efterfrågas av arbetsgivaren, det vill säga kompetensord som nämns i texten men som arbetsgivaren inte nämner att man förväntas kunna, och därför returneras dubbletter som förväntat.

För att få svar som innehåller unika kompetenser, som troligtvis är efterfrågade av arbetsgivaren, så kan du istället prova att använda denna endpoint: https://jobad-enrichments-api.jobtechdev.se/enrichtextdocumentsbinary

Om du vill läsa mer detaljer kring svarsobjekten som returneras vid anropen så kan du surfa hit: https://jobad-enrichments-api.jobtechdev.se/
…och scrolla längst ner på sidan, och sedan titta på dokumentationen för svarsobjekten för respektive endpoint.
Svarsobjektet för endpoint /enrichtextdocuments heter EnrichDocsResponse och svarsobjektet för /enrichtextdocumentsbinary heter EnrichDocsBinaryResponse

Hör gärna av dig igen om något var otydligt!

Vänliga hälsningar

/Mattias

Ett litet tillägg, här kan man läsa mer övergripande om API:et och hur man kommer igång:
https://github.com/Jobtechdev-content/JobAdEnrichments-content/blob/master/GettingstartedJobAdEnrichmentsSE.md