OCR för garnetiketter — databasen, inte bara skannern.
En OCR-motor utan en etikettdatabas gissar sig till märkesnamn. YarnScope har en kuraterad databas över etikettlayouter från Drops, Madelinetosh, Knit Picks, Cascade, Brooklyn Tweed, Quince, Malabrigo och dussintals fler — så att OCR:en vet var den ska titta.
Varför OCR ensamt inte räcker
En generisk OCR-modell kan till slut läsa varje ord på en garnetikett. Problemet är att garnetiketter inte är pressmeddelanden. De är en tät, märkesspecifik layout: färgkoden ligger i ett hörn, fiberprocenten i ett annat, färgnumret i ett tredje. Var exakt beror på märket.
Utan en databas returnerar OCR:en en vägg av ostrukturerad text och tolken måste gissa. Med en databas vet tolken att på en Drops Karisma-etikett ligger meterlängden till höger om viktgrammen, i en mindre stil, och att "100 %" tillförlitligt inleder fiberraden. Tolkningsprecisionen är skillnaden mellan "ja, spara" och "rätta färgnumret och löplängden och märkesraden".
Märken i databasen (urval)
- Flerspråkiga: Drops Design / Garnstudio (den största enskilda korpusen)
- Nordamerikansk mainstream: Knit Picks / WeCrochet, Lion Brand, Cascade, Berroco, Plymouth
- Indie / lyx: Madelinetosh, Malabrigo, Quince & Co., Brooklyn Tweed, Manos del Uruguay
- Nordiska: Sandnes Garn, Rauma, Isager, Holst, Pickles, Du Store Alpakka
- Storbritannien: Rowan, West Yorkshire Spinners, Jamieson & Smith
- Kontinentaleuropa: Schachenmayr, Lana Grossa, Lang Yarns, Adriafil, Plassard, Phildar, Bergère de France
- D2C / online: We Are Knitters, Wool and the Gang, Scheepjes, Durable
- Korsstygnstråd: DMC, Anchor, Madeira (igenkänning av härvnummer)
Nya märken läggs till varje vecka via två kanaler: uttryckliga önskemål från indiefärgare och rättelseloopen nedan.
Rättelseloopen — ett tryck lär upp motorn
När OCR:en läser fel på ett fält markerar granskningskortet den misstänkta cellen i orange. Du trycker på den, ändrar värdet och trycker på spara. Den rättelsen gör två saker: den hamnar i din garnförrådspost (korrekt) och den skickar en anonymiserad rättelsepost tillbaka till YarnScope. När trettio användare har rättat samma fält på samma märke tränas OCR-motorn om på det mönstret. Nästa person som skannar det märket ser det tolkat korrekt vid första försöket.
Inga rättelser skickas utan samtycke. Inställningen är på som standard men kan stängas av helt under Inställningar → Integritet → OCR-feedback. Att stänga av den försämrar inte dina egna skanningar; den hindrar bara dina rättelser från att förbättra motorn för andra.
Vad vi fångar och vad vi inte fångar
Vad vi fångar, tillfälligt: kamerabilden, avkodad till text, med OCR-motorn på vår server. Bilden hålls i minnet bara under tolkningen — under en sekund — och kastas sedan. De avkodade textfälten hamnar i din garnförrådspost.
Vad vi aldrig fångar: ansikten, händer, ytan bakom garnetiketten, något utanför den inställda etiketten. Kamerans blixt utlöses aldrig automatiskt. Kameran begärs bara när du trycker på Skanna.