I de historiska annonserna som finns publicerade på Nginx Directory ser jag att information om yrken (occupation, occupation_field, osv) finns i filerna från 2020 och framåt. I filerna från 2006-2019 står enbart ‘null’ i dessa fält.
Jag undrar:
Är informationen om yrken rapporterad av den som lade in annonsen (arbetsgivaren)?
Är skälet att sådan information saknas för äldre filer att arbetsgivare inte behövde ange information om yrken före 2020?
Har ni använt ett skript för att generera information om yrken utifrån annonstexterna och/eller finns ett sådant skript som man skulle kunna använda?
Hej!
De äldre annonsfilerna kommer från annan datakälla och är inte skapade på samma sätt som de nyare. Dessutom användes inte nuvarande taxonomin (med concept_id:n) på den tiden.
Vi har tyvärr inte möjlighet att lägga till yrkesinformation i efterhand på de äldre annonsfilerna.
Svar på följdfrågorna:
Ja det är arbetsgivaren som skapat annonsen som valt yrke. Exakt hur det går till beror på i vilket system annonsen skapats.
Det fanns tidigare en äldre taxonomi-databas som inte använde concept_id:n, men anledningen att data saknas i filerna är som sagt att de kommer från annan datakälla och filerna är inte skapade på samma sätt.
Nej, se svar punkt 1. Däremot finns sådan generad (berikad) data i annonserna under katalogen /berikade
I katalogen /berikade hittar jag annonser tillbaka till 2016. Väldigt bra! Jag undrar om det är möjligt att skapa berikade annonser ända tillbaka till 2006?
Vi har valt att inte göra det eftersom resultatet av berikningen inte blev tillräckligt bra för att göra annonserna sökbara. Kvalitén på data var helt enkelt inte tillräckligt god.
Annonsfilerna finns och JobAd Enrichments finns. Båda fria att använda så du kan alltid göra det själv.