OCR per le etichette dei filati — il database, non solo lo scanner.
Un motore OCR senza un database di etichette tira a indovinare i nomi delle marche. YarnScope ha un database curato dei formati di etichetta di Drops, Madelinetosh, Knit Picks, Cascade, Brooklyn Tweed, Quince, Malabrigo e decine d’altre — così l’OCR sa dove guardare.
Perché l'OCR da solo non basta
Un modello OCR generico, prima o poi, legge ogni parola su un’etichetta. Il problema è che le etichette non sono comunicati stampa. Sono un formato fitto e specifico per marca: il codice colore vive in un angolo, le percentuali delle fibre in un altro, il bagno di tintura in un terzo. Dove esattamente dipende dalla marca.
Senza un database, l’OCR restituisce un muro di testo senza struttura e il parser deve indovinare. Con un database, il parser sa che su un’etichetta Drops Karisma la metratura sta a destra del peso in grammi, in un carattere più piccolo, e che "100%" precede sempre la riga delle fibre. La precisione del parsing è la differenza tra "sì, salva" e "correggi il bagno di tintura, poi la metratura, poi la riga della marca".
Marche nel database (una selezione)
- Multilingue: Drops Design / Garnstudio (il corpus singolo più grande)
- Mainstream nordamericane: Knit Picks / WeCrochet, Lion Brand, Cascade, Berroco, Plymouth
- Indie / lusso: Madelinetosh, Malabrigo, Quince & Co., Brooklyn Tweed, Manos del Uruguay
- Nordiche: Sandnes Garn, Rauma, Isager, Holst, Pickles, Du Store Alpakka
- Britanniche: Rowan, West Yorkshire Spinners, Jamieson & Smith
- Europa continentale: Schachenmayr, Lana Grossa, Lang Yarns, Adriafil, Plassard, Phildar, Bergère de France
- D2C / online: We Are Knitters, Wool and the Gang, Scheepjes, Durable
- Filo da punto croce: DMC, Anchor, Madeira (riconoscimento del numero di matassina)
Ogni settimana si aggiungono nuove marche attraverso due canali: le richieste esplicite dei tintori indipendenti e il ciclo di correzione qui sotto.
Il ciclo di correzione — un tocco insegna al motore
Quando l’OCR legge male un campo, la scheda di controllo evidenzia in arancione la cella sospetta. Tu la tocchi, modifichi il valore e tocchi salva. Quella correzione fa due cose: arriva (corretta) nella tua scheda di scorta e invia un record di correzione anonimizzato a YarnScope. Dopo che trenta utenti correggono lo stesso campo sulla stessa marca, il motore OCR si riaddestra su quel formato. La persona successiva che scansiona quella marca lo vede riconosciuto bene già al primo colpo.
Nessuna correzione viene inviata senza consenso. L’opzione è attiva per impostazione predefinita ma si può disattivare del tutto in Impostazioni → Privacy → Feedback OCR. Disattivarla non peggiora le tue scansioni; impedisce solo alle tue correzioni di migliorare il motore per le altre.
Cosa catturiamo e cosa no
Cosa catturiamo, in modo transitorio: il fotogramma della fotocamera, decodificato in testo, con il motore OCR sul nostro server. Il fotogramma resta in memoria solo per il tempo del parsing — meno di un secondo — e poi viene scartato. I campi di testo decodificati arrivano nella tua scheda di scorta.
Cosa non catturiamo mai: volti, mani, la superficie dietro l’etichetta, qualsiasi cosa fuori dall’etichetta inquadrata. Il flash non scatta mai in automatico. La fotocamera viene richiesta solo quando tocchi Scansiona.