YarnScope
Nummer 001Forår / 2026Klaipėda · Et garnlager til seriøse strikkere og hæklere
04Motoren · OCR-database

OCR til garnetiketter — databasen, ikke bare scanneren.

En OCR-motor uden en etiketdatabase gætter sig til mærkenavne. YarnScope har en kurateret database over etiketlayouts fra Drops, Madelinetosh, Knit Picks, Cascade, Brooklyn Tweed, Quince, Malabrigo og dusinvis flere — så OCR’en ved, hvor den skal kigge.

Hvorfor OCR alene ikke er nok

En generisk OCR-model kan med tiden læse hvert ord på en garnetiket. Problemet er, at garnetiketter ikke er pressemeddelelser. De er et tæt, mærkespecifikt layout: farvekoden bor i ét hjørne, fiberprocenterne i et andet, farvepartiet i et tredje. Præcis hvor afhænger af mærket.

Uden en database returnerer OCR en mur af ustruktureret tekst, og parseren må gætte. Med en database ved parseren, at meterangivelsen på en Drops Karisma-etiket står til højre for vægten i gram, i en mindre skrift, og at "100 %" pålideligt indleder fiberlinjen. Parse-præcisionen er forskellen mellem "ja, gem" og "ret farvepartiet og løbelængden og mærkelinjen".

Mærker i databasen (et udvalg)

  • Flersprogede: Drops Design / Garnstudio (det største enkeltkorpus)
  • Nordamerikansk mainstream: Knit Picks / WeCrochet, Lion Brand, Cascade, Berroco, Plymouth
  • Indie / luksus: Madelinetosh, Malabrigo, Quince & Co., Brooklyn Tweed, Manos del Uruguay
  • Nordisk: Sandnes Garn, Rauma, Isager, Holst, Pickles, Du Store Alpakka
  • Storbritannien: Rowan, West Yorkshire Spinners, Jamieson & Smith
  • Kontinentaleuropa: Schachenmayr, Lana Grossa, Lang Yarns, Adriafil, Plassard, Phildar, Bergère de France
  • D2C / online: We Are Knitters, Wool and the Gang, Scheepjes, Durable
  • Korsstingsgarn: DMC, Anchor, Madeira (genkendelse af farvenummer)

Nye mærker tilføjes ugentligt ad to kanaler: udtrykkelige ønsker fra indie-farvere og rettelsesløkken herunder.

Rettelsesløkken — ét tryk lærer motoren det

Når OCR læser et felt forkert, fremhæver gennemsynskortet den mistænkelige celle med orange. Du trykker på den, retter værdien og trykker gem. Den rettelse gør to ting: den lander i din garnlager-post (korrekt), og den sender en anonymiseret rettelsespost tilbage til YarnScope. Når tredive brugere har rettet det samme felt på det samme mærke, gentræner OCR-motoren på det mønster. Den næste, der scanner det mærke, ser det aflæst korrekt allerede ved første forsøg.

Ingen rettelser sendes uden samtykke. Indstillingen er slået til som standard, men kan slås helt fra i Indstillinger → Privatliv → OCR-feedback. At slå den fra forringer ikke dine egne scanninger; det stopper bare dine rettelser fra at forbedre motoren for andre.

Hvad vi fanger, og hvad vi ikke fanger

Hvad vi fanger, flygtigt: kamerabilledet, afkodet til tekst, med OCR-motoren på vores server. Billedet holdes kun i hukommelsen, så længe parsingen varer — under ét sekund — og kasseres så. De afkodede tekstfelter lander på din garnlager-post.

Hvad vi aldrig fanger: ansigter, hænder, overfladen bag garnetiketten, alt uden for den indrammede etiket. Kameraets blitz udløses aldrig automatisk. Kameraet aktiveres kun, når du trykker Scan.

Spørgsmål om OCR-motoren

Hvordan er OCR med en database anderledes end generisk OCR?
Generisk OCR læser teksten på et billede. En database fortæller motoren, hvor hvert felt bor på etiketten — mærke øverst til venstre, farveparti nederst til højre, fibersammensætning under garnnavnet. At vide, hvor man skal kigge, forvandler "læs alt" til "udfyld de rigtige felter".
Hvor får I etiketlayoutsne fra?
Fra offentlig etiketfotografering (mærkernes marketingbilleder, Ravelry-licenserede bruger-uploads med samtykke, YarnScopes prøve-lager). Intet garnmærke har delt private data med os. Indie-farvere kan bede om at blive medtaget på start@djump.io.
Hvad hvis jeg scanner en udgået Rowan-etiket fra 1996?
Udgåede etiketter genkendes delvist. Mærke og fiber parses som regel; løbelængden kan kræve en manuel rettelse. Vi tilføjer gamle etiketter, efterhånden som brugerne bidrager med rettelser.
Læser YarnScope stregkoder på garnbutikkens prismærker?
Ikke endnu, og vi afgrænsede med vilje OCR’en til selve garnetiketten frem for garnbutikkens prismærke. Garnetiketten rejser med garnet; prismærket bliver i butikken.
Bruges mine scannede billeder til at træne OCR’en?
Kun når du udtrykkeligt retter et fejllæst felt, sender vi anonymiserede rettelser tilbage for at forbedre motoren. Selve billederne forlader aldrig din enhed, medmindre du vedhæfter dem til en garnlager-post.