OCR lankaetiketeille — tietokanta, ei pelkkä skanneri.
OCR-moottori ilman etikettitietokantaa arvaa merkkien nimet. YarnScopella on huolella koottu tietokanta lankaetikettien asetteluista merkeiltä Drops, Madelinetosh, Knit Picks, Cascade, Brooklyn Tweed, Quince, Malabrigo ja kymmeniltä muilta — jotta OCR tietää, mistä katsoa.
Miksi pelkkä OCR ei riitä
Yleinen OCR-malli osaa lukea ennen pitkää jokaisen sanan lankaetiketistä. Ongelma on, etteivät lankaetiketit ole lehdistötiedotteita. Ne ovat tiheä, merkkikohtainen asettelu: värikoodi asuu yhdessä nurkassa, kuituprosentit toisessa, värierä kolmannessa. Missä tarkalleen, riippuu merkistä.
Ilman tietokantaa OCR palauttaa muurin jäsentämätöntä tekstiä, ja jäsentäjän on arvattava. Tietokannan kanssa jäsentäjä tietää, että Drops Karisman etiketissä metrimäärä on painogrammoista oikealla, pienemmällä fontilla, ja että "100 %" edeltää luotettavasti kuituriviä. Jäsennystarkkuus on ero "kyllä, tallenna" ja "korjaa värierä, juoksumetrit ja merkkirivi" välillä.
Merkit tietokannassa (valikoima)
- Monikieliset: Drops Design / Garnstudio (suurin yksittäinen korpus)
- Pohjoisamerikkalainen valtavirta: Knit Picks / WeCrochet, Lion Brand, Cascade, Berroco, Plymouth
- Indie / luksus: Madelinetosh, Malabrigo, Quince & Co., Brooklyn Tweed, Manos del Uruguay
- Pohjoismaiset: Sandnes Garn, Rauma, Isager, Holst, Pickles, Du Store Alpakka
- Britannia: Rowan, West Yorkshire Spinners, Jamieson & Smith
- Manner-Eurooppa: Schachenmayr, Lana Grossa, Lang Yarns, Adriafil, Plassard, Phildar, Bergère de France
- D2C / verkko: We Are Knitters, Wool and the Gang, Scheepjes, Durable
- Ristipistolanka: DMC, Anchor, Madeira (vyyhdin numeron tunnistus)
Uusia merkkejä lisätään viikoittain kahta kautta: indie-värjääjien nimenomaiset pyynnöt ja alla oleva korjaussilmukka.
Korjaussilmukka — yksi napautus opettaa moottorin
Kun OCR lukee kentän väärin, tarkistuskortti korostaa epäilyttävän solun oranssilla. Napautat sitä, muokkaat arvoa ja napautat tallenna. Tuo korjaus tekee kaksi asiaa: se päätyy lankavarastosi merkintään (oikein) ja lähettää anonyymin korjaustietueen takaisin YarnScopelle. Kun kolmekymmentä käyttäjää korjaa saman kentän samalla merkillä, OCR-moottori opetetaan uudelleen tuolla kaavalla. Seuraava saman merkin skannaaja näkee sen oikein jäsennettynä ensi yrittämällä.
Korjauksia ei lähetetä ilman suostumusta. Asetus on oletuksena päällä, mutta sen voi kytkeä kokonaan pois kohdasta Asetukset → Tietosuoja → OCR-palaute. Sen poiskytkentä ei heikennä omia skannauksiasi; se vain estää korjauksiasi parantamasta moottoria muille.
Mitä tallennamme ja mitä emme
Mitä tallennamme väliaikaisesti: kameran ruudun, dekoodattuna tekstiksi, OCR-moottorilla palvelimellamme. Ruutu säilyy muistissa vain jäsennyksen ajan — alle sekunnin — ja sitten hylätään. Dekoodatut tekstikentät päätyvät lankavarastosi merkintään.
Mitä emme koskaan tallenna: kasvoja, käsiä, etiketin takana olevaa pintaa, mitään rajatun etiketin ulkopuolelta. Kameran salama ei koskaan välähdä automaattisesti. Kameraa pyydetään vain, kun napautat Skannaa.