OCR for garnetiketter — databasen, ikke bare skanneren.
En OCR-motor uten en etikettdatabase gjetter på merkenavn. YarnScope har en kuratert database over banderolle-oppsett fra Drops, Madelinetosh, Knit Picks, Cascade, Brooklyn Tweed, Quince, Malabrigo og dusinvis flere — så OCR-en vet hvor den skal se.
Hvorfor OCR alene ikke holder
En generisk OCR-modell kan, før eller siden, lese hvert ord på en banderolle. Problemet er at banderoller ikke er pressemeldinger. De er et tett, merkespesifikt oppsett: fargekoden bor i ett hjørne, fiberprosentene i et annet, partinummeret i et tredje. Nøyaktig hvor avhenger av merket.
Uten en database returnerer OCR-en en vegg av ustrukturert tekst, og tolkeren må gjette. Med en database vet tolkeren at på en Drops Karisma-banderolle står meterantallet til høyre for vektgrammene, i en mindre skrift, og at «100 %» pålitelig innleder fiberlinjen. Tolkenøyaktigheten er forskjellen mellom «ja, lagre» og «rett opp partinummeret og løpelengden og merkelinjen».
Merker i databasen (utvalg)
- Flerspråklige: Drops Design / Garnstudio (det største enkeltkorpuset)
- Nordamerikansk mainstream: Knit Picks / WeCrochet, Lion Brand, Cascade, Berroco, Plymouth
- Indie / luksus: Madelinetosh, Malabrigo, Quince & Co., Brooklyn Tweed, Manos del Uruguay
- Nordiske: Sandnes Garn, Rauma, Isager, Holst, Pickles, Du Store Alpakka
- Storbritannia: Rowan, West Yorkshire Spinners, Jamieson & Smith
- Kontinental-EU: Schachenmayr, Lana Grossa, Lang Yarns, Adriafil, Plassard, Phildar, Bergère de France
- D2C / nettbutikk: We Are Knitters, Wool and the Gang, Scheepjes, Durable
- Korssting-broderigarn: DMC, Anchor, Madeira (gjenkjenning av docknummer)
Nye merker legges til ukentlig via to kanaler: eksplisitte forespørsler fra indie-fargere og rettelsessløyfen under.
Rettelsessløyfen — ett trykk lærer motoren
Når OCR-en leser et felt feil, fremhever gjennomgangskortet den mistenkte cellen i oransje. Du trykker på den, redigerer verdien og trykker lagre. Den rettelsen gjør to ting: den lander i garnlager-oppføringen din (riktig), og den sender en anonymisert rettelsespost tilbake til YarnScope. Etter at tretti brukere har rettet det samme feltet på det samme merket, trener OCR-motoren seg på nytt på det mønsteret. Neste person som skanner det merket, ser det tolket riktig på første forsøk.
Ingen rettelser sendes uten samtykke. Innstillingen er på som standard, men kan slås helt av under Innstillinger → Personvern → OCR-tilbakemelding. Å slå den av forringer ikke dine egne skanninger; det stopper bare rettelsene dine fra å forbedre motoren for andre.
Hva vi fanger, og hva vi ikke fanger
Det vi fanger, flyktig: kamerabildet, dekodet til tekst, med OCR-motoren på serveren vår. Bildet holdes i minnet bare så lenge tolkningen varer — under ett sekund — og forkastes deretter. De dekodede tekstfeltene lander på garnlager-oppføringen din.
Det vi aldri fanger: ansikter, hender, overflaten bak banderollen, alt som ligger utenfor den innrammede banderollen. Kamerablitsen utløses aldri automatisk. Kameraet etterspørres bare når du trykker på Skann.