04엔진 · OCR 데이터베이스

실 라벨 OCR — 스캐너가 아니라, 데이터베이스가 핵심.

라벨 데이터베이스가 없는 OCR 엔진은 브랜드 이름을 짐작할 뿐입니다. YarnScope에는 Drops, Madelinetosh, Knit Picks, Cascade, Brooklyn Tweed, Quince, Malabrigo 등 수십 개 브랜드의 라벨 레이아웃을 정리한 데이터베이스가 있습니다 — 그래서 OCR이 어디를 봐야 하는지 압니다.

OCR만으로는 부족한 이유

일반 OCR 모델도 라벨의 모든 글자를 결국 읽기는 합니다. 문제는 라벨이 보도자료가 아니라는 점입니다. 라벨은 브랜드마다 다른, 빽빽한 레이아웃입니다 — 색상 코드는 한쪽 구석에, 섬유 혼용률은 다른 구석에, 로트 번호는 또 다른 구석에. 정확히 어디인지는 브랜드에 따라 다릅니다.

데이터베이스가 없으면 OCR은 구조 없는 글자 덩어리를 내놓고, 파서는 짐작해야 합니다. 데이터베이스가 있으면 파서는 Drops Karisma 라벨에서 미터 수가 그램 무게 오른쪽에 더 작은 글꼴로 있다는 것, 그리고 "100%"가 섬유 줄 앞에 어김없이 붙는다는 것을 압니다. 이 인식 정확도가 "네, 저장하세요"와 "로트 번호랑 분량이랑 브랜드 줄을 고치세요"의 차이를 만듭니다.

데이터베이스에 들어간 브랜드 (일부)

다국어: Drops Design / Garnstudio (가장 큰 단일 코퍼스)
북미 주류: Knit Picks / WeCrochet, Lion Brand, Cascade, Berroco, Plymouth
인디 / 럭셔리: Madelinetosh, Malabrigo, Quince & Co., Brooklyn Tweed, Manos del Uruguay
노르딕: Sandnes Garn, Rauma, Isager, Holst, Pickles, Du Store Alpakka
영국: Rowan, West Yorkshire Spinners, Jamieson & Smith
유럽 대륙: Schachenmayr, Lana Grossa, Lang Yarns, Adriafil, Plassard, Phildar, Bergère de France
D2C / 온라인: We Are Knitters, Wool and the Gang, Scheepjes, Durable
십자수 플로스: DMC, Anchor, Madeira (실 번호 인식)

새 브랜드는 두 경로로 매주 추가됩니다 — 인디 염색가의 직접 요청, 그리고 아래의 수정 루프.

수정 루프 — 한 번의 터치가 엔진을 가르칩니다

OCR이 항목을 잘못 읽으면 확인 카드가 의심스러운 칸을 주황색으로 표시합니다. 그 칸을 눌러 값을 고치고 저장을 누르세요. 이 수정은 두 가지 일을 합니다 — 당신의 재고 항목에 (제대로) 반영되고, 익명 처리된 수정 기록이 YarnScope로 전송됩니다. 같은 브랜드의 같은 항목을 서른 명이 고치면, OCR 엔진이 그 패턴을 다시 학습합니다. 다음에 그 브랜드를 스캔하는 사람은 첫 시도에 제대로 읽힌 결과를 봅니다.

동의 없이는 어떤 수정도 전송되지 않습니다. 이 설정은 기본으로 켜져 있지만, 설정 → 개인정보 → OCR 피드백에서 완전히 끌 수 있습니다. 꺼도 당신의 스캔 품질은 그대로이며, 단지 당신의 수정이 다른 사람을 위한 엔진 개선에 쓰이지 않을 뿐입니다.

무엇을 담고, 무엇을 담지 않는가

일시적으로 담는 것: 카메라 프레임을 우리 서버의 OCR 엔진으로 텍스트로 해독합니다. 프레임은 해독되는 동안만 — 1초도 안 되는 시간 동안 — 메모리에 머물다 폐기됩니다. 해독된 텍스트 항목이 당신의 재고 항목에 반영됩니다.

절대 담지 않는 것: 얼굴, 손, 라벨 뒤의 표면, 화면에 잡힌 라벨 밖의 그 무엇도. 카메라 플래시는 자동으로 켜지지 않습니다. 카메라는 당신이 스캔을 누를 때만 요청됩니다.

OCR 엔진에 대한 질문

데이터베이스가 있는 OCR은 일반 OCR과 뭐가 다른가요?

일반 OCR은 사진 속 글자를 읽습니다. 데이터베이스는 각 항목이 라벨 어디에 있는지를 엔진에 알려 줍니다 — 브랜드는 왼쪽 위, 로트 번호는 오른쪽 아래, 섬유 혼용률은 실 이름 아래. 어디를 봐야 하는지 아는 순간, "전부 읽기"가 "맞는 칸 채우기"로 바뀝니다.

라벨 레이아웃은 어디서 얻나요?

공개된 라벨 사진(브랜드 마케팅 이미지, 동의를 받아 Ravelry에 올라온 사용자 업로드, YarnScope 샘플 재고)에서 얻습니다. 어떤 실 브랜드도 비공개 데이터를 공유한 적 없습니다. 인디 염색가는 start@djump.io로 포함을 요청할 수 있습니다.

1996년 Rowan 빈티지 라벨을 스캔하면요?

단종된 라벨은 부분적으로 인식됩니다. 브랜드와 섬유는 보통 읽히지만, 분량은 직접 고쳐야 할 수 있습니다. 사용자가 수정을 보태 주는 대로 빈티지 라벨을 추가합니다.

YarnScope가 실 가게 가격표의 바코드도 읽나요?

아직은 아닙니다. OCR 범위를 실 가게 가격표가 아니라 라벨 자체로 의도적으로 한정했습니다. 라벨은 실과 함께 따라오지만, 가격표는 가게에 남으니까요.

제가 스캔한 사진이 OCR 학습에 쓰이나요?

잘못 읽은 항목을 직접 고칠 때에만 익명 처리된 수정 내역을 보내 엔진을 개선합니다. 사진 자체는 재고 항목에 직접 첨부하지 않는 한 기기를 벗어나지 않습니다.