YarnScope
Numero 001Kevät / 2026Klaipėda · Lankavarasto tosi neulojille ja virkkaajille
04Moottori · OCR-tietokanta

OCR lankaetiketeille — tietokanta, ei pelkkä skanneri.

OCR-moottori ilman etikettitietokantaa arvaa merkkien nimet. YarnScopella on huolella koottu tietokanta lankaetikettien asetteluista merkeiltä Drops, Madelinetosh, Knit Picks, Cascade, Brooklyn Tweed, Quince, Malabrigo ja kymmeniltä muilta — jotta OCR tietää, mistä katsoa.

Miksi pelkkä OCR ei riitä

Yleinen OCR-malli osaa lukea ennen pitkää jokaisen sanan lankaetiketistä. Ongelma on, etteivät lankaetiketit ole lehdistötiedotteita. Ne ovat tiheä, merkkikohtainen asettelu: värikoodi asuu yhdessä nurkassa, kuituprosentit toisessa, värierä kolmannessa. Missä tarkalleen, riippuu merkistä.

Ilman tietokantaa OCR palauttaa muurin jäsentämätöntä tekstiä, ja jäsentäjän on arvattava. Tietokannan kanssa jäsentäjä tietää, että Drops Karisman etiketissä metrimäärä on painogrammoista oikealla, pienemmällä fontilla, ja että "100 %" edeltää luotettavasti kuituriviä. Jäsennystarkkuus on ero "kyllä, tallenna" ja "korjaa värierä, juoksumetrit ja merkkirivi" välillä.

Merkit tietokannassa (valikoima)

  • Monikieliset: Drops Design / Garnstudio (suurin yksittäinen korpus)
  • Pohjoisamerikkalainen valtavirta: Knit Picks / WeCrochet, Lion Brand, Cascade, Berroco, Plymouth
  • Indie / luksus: Madelinetosh, Malabrigo, Quince & Co., Brooklyn Tweed, Manos del Uruguay
  • Pohjoismaiset: Sandnes Garn, Rauma, Isager, Holst, Pickles, Du Store Alpakka
  • Britannia: Rowan, West Yorkshire Spinners, Jamieson & Smith
  • Manner-Eurooppa: Schachenmayr, Lana Grossa, Lang Yarns, Adriafil, Plassard, Phildar, Bergère de France
  • D2C / verkko: We Are Knitters, Wool and the Gang, Scheepjes, Durable
  • Ristipistolanka: DMC, Anchor, Madeira (vyyhdin numeron tunnistus)

Uusia merkkejä lisätään viikoittain kahta kautta: indie-värjääjien nimenomaiset pyynnöt ja alla oleva korjaussilmukka.

Korjaussilmukka — yksi napautus opettaa moottorin

Kun OCR lukee kentän väärin, tarkistuskortti korostaa epäilyttävän solun oranssilla. Napautat sitä, muokkaat arvoa ja napautat tallenna. Tuo korjaus tekee kaksi asiaa: se päätyy lankavarastosi merkintään (oikein) ja lähettää anonyymin korjaustietueen takaisin YarnScopelle. Kun kolmekymmentä käyttäjää korjaa saman kentän samalla merkillä, OCR-moottori opetetaan uudelleen tuolla kaavalla. Seuraava saman merkin skannaaja näkee sen oikein jäsennettynä ensi yrittämällä.

Korjauksia ei lähetetä ilman suostumusta. Asetus on oletuksena päällä, mutta sen voi kytkeä kokonaan pois kohdasta Asetukset → Tietosuoja → OCR-palaute. Sen poiskytkentä ei heikennä omia skannauksiasi; se vain estää korjauksiasi parantamasta moottoria muille.

Mitä tallennamme ja mitä emme

Mitä tallennamme väliaikaisesti: kameran ruudun, dekoodattuna tekstiksi, OCR-moottorilla palvelimellamme. Ruutu säilyy muistissa vain jäsennyksen ajan — alle sekunnin — ja sitten hylätään. Dekoodatut tekstikentät päätyvät lankavarastosi merkintään.

Mitä emme koskaan tallenna: kasvoja, käsiä, etiketin takana olevaa pintaa, mitään rajatun etiketin ulkopuolelta. Kameran salama ei koskaan välähdä automaattisesti. Kameraa pyydetään vain, kun napautat Skannaa.

Kysymyksiä OCR-moottorista

Miten tietokannallinen OCR eroaa yleisestä OCR:stä?
Yleinen OCR lukee kuvan tekstin. Tietokanta kertoo moottorille, missä kukin kenttä etiketissä asuu — merkki ylävasemmalla, värierä alaoikealla, kuitukoostumus langan nimen alla. Sen tietäminen, mistä katsoa, muuttaa "lue kaikki" muotoon "täytä oikeat ruudut".
Mistä saatte lankaetikettien asettelut?
Julkisesta etikettivalokuvauksesta (merkkien markkinointikuvat, Ravelryn lisensoimat käyttäjälataukset suostumuksella, YarnScopen näytelankavarasto). Yksikään lankamerkki ei ole jakanut meille yksityistä dataa. Indie-värjääjät voivat pyytää mukaanottoa osoitteesta start@djump.io.
Entä jos skannaan vanhan Rowan-etiketin vuodelta 1996?
Painoksesta poistuneet etiketit tunnistetaan osittain. Merkki ja kuitu yleensä jäsentyvät; juoksumetrit voivat vaatia käsin korjauksen. Lisäämme vanhoja etikettejä sitä mukaa kun käyttäjät tuovat korjauksia.
Lukeeko YarnScope viivakoodeja lankakaupan tageista?
Ei vielä, ja rajasimme OCR:n tarkoituksella itse lankaetikettiin lankakaupan hintatagin sijaan. Lankaetiketti matkaa langan mukana; hintatagi jää kauppaan.
Käytetäänkö skannaamiani kuvia OCR:n opettamiseen?
Vain kun nimenomaisesti korjaat väärin luetun kentän, lähetämme anonyymejä korjauksia takaisin moottorin parantamiseksi. Itse kuvat eivät koskaan poistu laitteeltasi, ellet liitä niitä lankavaraston merkintään.