JobTech Development forum

Vad är rätt data i "JobSearch" API'et kontra platsbankens web?

Hej,

Jag har en ide om att skapa en jobbsökning som också kan ge besked om pendlingsavstånd och då inte endast i sträcka utan i tid och med olika kommunikationsmedel.

Men nu har jag stött på patrull då jag inte får ut korrekt information.

Vi tar ett exempel: Sök lediga jobb i Platsbanken - Arbetsförmedlingen

På websidan kan jag läsa: Postadress

Arbetsförmedlingen
Elektrogatan 4
11399 Stockholm

Via API https://jobsearch.api.jobtechdev.se
Så extraherade jag :

            "workplace_address": {
                "coordinates": [18.008434, 59.368877]

Men den koordinaten [18.008434, 59.368877] pekar på en helt annan plats:
Målbron, Vasalund, Hagalund, Solna kommun, Stockholms län, 169 03, Sverige

Postadr har koordinaterna (“17.9787184, 59.3564237”)
Elektrogatan, Solna strand, Råsunda, Solna kommun, Sundbybergs kommun, Stockholms län, 17263, Sverige

Så min fundering är:

  1. I APIet får jag endast ut koordinaterna inte post adr.

  2. Vilken är rätt adress ?

  3. Är det ens möjligt att få till min ide med nuvarande data?

1 gillning

Hej, kul idé!

Men tyvärr:
I många fall saknar annonserna adress pga att arbetsgivaren inte skrivit in det när annonsen skapades.

Koordinater kan läggas in med olika precision.
När jag gör stickprov så är det absolut vanligaste (ca 75% av fallen) att precisionen är på kommun-nivå.
Det presenteras inte i api-svaret. Du skulle behöva nivån “postnummer” eller “gatuadress”, men de är rätt sällsynta (12 resp 6%). En del annonser saknar koordinater helt.

Tyvärr räcker nog inte datat som läggs in i annonsen för att göra vad du tänkt.

I nuläget skulle du nog behöva hitta adress på annat håll med hjälp av företagsinfon i annonsen, men det är inte säkert att den adressen matchar den faktiska arbetsplatsen (det är i och för sig inte säkert med en adress i annonsen heller)

Oj, om inte ens arbetsförmedlingen följer sina egna specifikationer ?
Refererar till punkt 2 där koordinaterna ligger långt ifrån varandra.

Är det inte dags att KRÄVA rätt data från de som lägger in annonserna ? För felaktig data hämmar ju innovation och som det går att läsa andra trådar om “öppen data”, “få fler att använda” och liknande.

Vem är det som kan sätta ner foten ? Vem ska jag ringa ?

Hej Mats!
Skälet till att kvaliteten är låg beror på att är det är ganska många parter iblandade, ett onödigt stort annonsformat och att datan inte kan valideras vid mottagande av AF. Men jag hoppas och tror att det vi kommer se en betydande förbättring i en hyfsat nära framtid när systemet som externa annonser kommer in via kommer börja bytas ut. (Förväntar mej att det börjar byggas tidigt 2022). Det kommer innebära ett förenklat annonsformat där det blir tydligare vilken data som ska in var. Det kommer att göra annonskvalien bättre. Med utbytande av systemet kommer det även gå att börja inför valideringar av datan vilket också bör höja kvalitén.
Man känner igen dessa annonser på att source type ser ut så här:

"source_type": "VIA_PLATSBANKEN_DXA",

Jag kommer ta med din feedback till uppstartsmötet kring nytt format och annons-mottagar-API nu i veckan. Jag tror att alla de som jobbar med de interna annonseringssystemen kommer hålla med dej. Ditt exempel på annons understryker verkligen problemet.

Tack Johan och jag har börjat med att:

  1. Söka jobb hos AF, så kanske vi blir kollegor (fast av tre måste kriterier så hade jag inget) men sunt förnuft och huvudet på skaft fanns inte med;-)

  2. Python och json börjar sippra in i hjärnan.

  3. Som vi sa på web mötet S(h)IS(h)O, så jag hoppas verkligen att kvaliteten höjs och går till “Mandatory” så att förmedlingsfirmorna inte kan fejka adr. genom att uppge sin egen adr. som

workplace_address

Ser verkligen fram till att man inte kan lägga in felaktig/falsk data i systemet.

Så tack för att du för det vidare.

1 gillning