실 라벨 OCR — 스캐너가 아니라, 데이터베이스가 핵심.
라벨 데이터베이스가 없는 OCR 엔진은 브랜드 이름을 짐작할 뿐입니다. YarnScope에는 Drops, Madelinetosh, Knit Picks, Cascade, Brooklyn Tweed, Quince, Malabrigo 등 수십 개 브랜드의 라벨 레이아웃을 정리한 데이터베이스가 있습니다 — 그래서 OCR이 어디를 봐야 하는지 압니다.
OCR만으로는 부족한 이유
일반 OCR 모델도 라벨의 모든 글자를 결국 읽기는 합니다. 문제는 라벨이 보도자료가 아니라는 점입니다. 라벨은 브랜드마다 다른, 빽빽한 레이아웃입니다 — 색상 코드는 한쪽 구석에, 섬유 혼용률은 다른 구석에, 로트 번호는 또 다른 구석에. 정확히 어디인지는 브랜드에 따라 다릅니다.
데이터베이스가 없으면 OCR은 구조 없는 글자 덩어리를 내놓고, 파서는 짐작해야 합니다. 데이터베이스가 있으면 파서는 Drops Karisma 라벨에서 미터 수가 그램 무게 오른쪽에 더 작은 글꼴로 있다는 것, 그리고 "100%"가 섬유 줄 앞에 어김없이 붙는다는 것을 압니다. 이 인식 정확도가 "네, 저장하세요"와 "로트 번호랑 분량이랑 브랜드 줄을 고치세요"의 차이를 만듭니다.
데이터베이스에 들어간 브랜드 (일부)
- 다국어: Drops Design / Garnstudio (가장 큰 단일 코퍼스)
- 북미 주류: Knit Picks / WeCrochet, Lion Brand, Cascade, Berroco, Plymouth
- 인디 / 럭셔리: Madelinetosh, Malabrigo, Quince & Co., Brooklyn Tweed, Manos del Uruguay
- 노르딕: Sandnes Garn, Rauma, Isager, Holst, Pickles, Du Store Alpakka
- 영국: Rowan, West Yorkshire Spinners, Jamieson & Smith
- 유럽 대륙: Schachenmayr, Lana Grossa, Lang Yarns, Adriafil, Plassard, Phildar, Bergère de France
- D2C / 온라인: We Are Knitters, Wool and the Gang, Scheepjes, Durable
- 십자수 플로스: DMC, Anchor, Madeira (실 번호 인식)
새 브랜드는 두 경로로 매주 추가됩니다 — 인디 염색가의 직접 요청, 그리고 아래의 수정 루프.
수정 루프 — 한 번의 터치가 엔진을 가르칩니다
OCR이 항목을 잘못 읽으면 확인 카드가 의심스러운 칸을 주황색으로 표시합니다. 그 칸을 눌러 값을 고치고 저장을 누르세요. 이 수정은 두 가지 일을 합니다 — 당신의 재고 항목에 (제대로) 반영되고, 익명 처리된 수정 기록이 YarnScope로 전송됩니다. 같은 브랜드의 같은 항목을 서른 명이 고치면, OCR 엔진이 그 패턴을 다시 학습합니다. 다음에 그 브랜드를 스캔하는 사람은 첫 시도에 제대로 읽힌 결과를 봅니다.
동의 없이는 어떤 수정도 전송되지 않습니다. 이 설정은 기본으로 켜져 있지만, 설정 → 개인정보 → OCR 피드백에서 완전히 끌 수 있습니다. 꺼도 당신의 스캔 품질은 그대로이며, 단지 당신의 수정이 다른 사람을 위한 엔진 개선에 쓰이지 않을 뿐입니다.
무엇을 담고, 무엇을 담지 않는가
일시적으로 담는 것: 카메라 프레임을 우리 서버의 OCR 엔진으로 텍스트로 해독합니다. 프레임은 해독되는 동안만 — 1초도 안 되는 시간 동안 — 메모리에 머물다 폐기됩니다. 해독된 텍스트 항목이 당신의 재고 항목에 반영됩니다.
절대 담지 않는 것: 얼굴, 손, 라벨 뒤의 표면, 화면에 잡힌 라벨 밖의 그 무엇도. 카메라 플래시는 자동으로 켜지지 않습니다. 카메라는 당신이 스캔을 누를 때만 요청됩니다.