YarnScope
Nummer № 001Vår / 2026Klaipėda · Et garnlager for seriøse strikkere og heklere
04Motoren · OCR-database

OCR for garnetiketter — databasen, ikke bare skanneren.

En OCR-motor uten en etikettdatabase gjetter på merkenavn. YarnScope har en kuratert database over banderolle-oppsett fra Drops, Madelinetosh, Knit Picks, Cascade, Brooklyn Tweed, Quince, Malabrigo og dusinvis flere — så OCR-en vet hvor den skal se.

Hvorfor OCR alene ikke holder

En generisk OCR-modell kan, før eller siden, lese hvert ord på en banderolle. Problemet er at banderoller ikke er pressemeldinger. De er et tett, merkespesifikt oppsett: fargekoden bor i ett hjørne, fiberprosentene i et annet, partinummeret i et tredje. Nøyaktig hvor avhenger av merket.

Uten en database returnerer OCR-en en vegg av ustrukturert tekst, og tolkeren må gjette. Med en database vet tolkeren at på en Drops Karisma-banderolle står meterantallet til høyre for vektgrammene, i en mindre skrift, og at «100 %» pålitelig innleder fiberlinjen. Tolkenøyaktigheten er forskjellen mellom «ja, lagre» og «rett opp partinummeret og løpelengden og merkelinjen».

Merker i databasen (utvalg)

  • Flerspråklige: Drops Design / Garnstudio (det største enkeltkorpuset)
  • Nordamerikansk mainstream: Knit Picks / WeCrochet, Lion Brand, Cascade, Berroco, Plymouth
  • Indie / luksus: Madelinetosh, Malabrigo, Quince & Co., Brooklyn Tweed, Manos del Uruguay
  • Nordiske: Sandnes Garn, Rauma, Isager, Holst, Pickles, Du Store Alpakka
  • Storbritannia: Rowan, West Yorkshire Spinners, Jamieson & Smith
  • Kontinental-EU: Schachenmayr, Lana Grossa, Lang Yarns, Adriafil, Plassard, Phildar, Bergère de France
  • D2C / nettbutikk: We Are Knitters, Wool and the Gang, Scheepjes, Durable
  • Korssting-broderigarn: DMC, Anchor, Madeira (gjenkjenning av docknummer)

Nye merker legges til ukentlig via to kanaler: eksplisitte forespørsler fra indie-fargere og rettelsessløyfen under.

Rettelsessløyfen — ett trykk lærer motoren

Når OCR-en leser et felt feil, fremhever gjennomgangskortet den mistenkte cellen i oransje. Du trykker på den, redigerer verdien og trykker lagre. Den rettelsen gjør to ting: den lander i garnlager-oppføringen din (riktig), og den sender en anonymisert rettelsespost tilbake til YarnScope. Etter at tretti brukere har rettet det samme feltet på det samme merket, trener OCR-motoren seg på nytt på det mønsteret. Neste person som skanner det merket, ser det tolket riktig på første forsøk.

Ingen rettelser sendes uten samtykke. Innstillingen er på som standard, men kan slås helt av under Innstillinger → Personvern → OCR-tilbakemelding. Å slå den av forringer ikke dine egne skanninger; det stopper bare rettelsene dine fra å forbedre motoren for andre.

Hva vi fanger, og hva vi ikke fanger

Det vi fanger, flyktig: kamerabildet, dekodet til tekst, med OCR-motoren på serveren vår. Bildet holdes i minnet bare så lenge tolkningen varer — under ett sekund — og forkastes deretter. De dekodede tekstfeltene lander på garnlager-oppføringen din.

Det vi aldri fanger: ansikter, hender, overflaten bak banderollen, alt som ligger utenfor den innrammede banderollen. Kamerablitsen utløses aldri automatisk. Kameraet etterspørres bare når du trykker på Skann.

Spørsmål om OCR-motoren

Hvordan er OCR med en database forskjellig fra generisk OCR?
Generisk OCR leser teksten i et bilde. En database forteller motoren hvor hvert felt bor på banderollen — merke øverst til venstre, partinummer nederst til høyre, fibersammensetning under garnnavnet. Å vite hvor den skal se, gjør «les alt» om til «fyll de riktige boksene».
Hvor får dere banderolle-oppsettene fra?
Fra offentlig banderolle-fotografi (markedsføringsbilder fra merkene, Ravelry-lisensierte brukeropplastinger med samtykke, YarnScopes prøve-garnlager). Ingen garnmerker har delt private data med oss. Indie-fargere kan be om å bli inkludert på start@djump.io.
Hva om jeg skanner en utgått Rowan-banderolle fra 1996?
Banderoller som ikke produseres lenger, gjenkjennes delvis. Merke og fiber tolkes som regel; løpelengden kan trenge en manuell rettelse. Vi legger til gamle banderoller etter hvert som brukere bidrar med rettelser.
Leser YarnScope strekkoder på prisetiketter fra garnbutikken?
Ikke ennå, og vi avgrenset OCR-en bevisst til selve banderollen i stedet for prislappen fra garnbutikken. Banderollen følger garnet; prislappen blir igjen i butikken.
Brukes de skannede bildene mine til å trene OCR-en?
Bare når du eksplisitt retter opp et feillest felt, sender vi anonymiserte rettelser tilbake for å forbedre motoren. Selve bildene forlater aldri enheten din med mindre du legger dem ved en garnlager-oppføring.