English | 한국어
(source: manga109, © Kanno Hiroshi, © Okuda Momoko, © Kato Masaki)
SickZil-Machine automates texts removal during manga/comics translation(Scanlation) process.
All of the above images were edited automatically without human intervention.
(source: manga109, © Shimazaki Yuzuru, © Akamatsu Ken, © Kobayashi Yuki)
SickZil-Machine finds out the texts in manga/comics and erases it naturally to match the background.
Both processes are completely automatic, without any additional human intervention.
Of course, if you want, you can also specify text area you want to erase.
By the way, SickZil is korean word 식질, slang of 식자(작업). 식자 means editing manga/comics according to the translation(from translator).
We applied U-net for SegNet and Deepfill v2 for ComplNet.
SickZil-Machine consists of two deep learning models, SegNet and ComplNet.
To learn SegNet, we need original manga images and
text component masks that cover all text area corresponding to the original images.
To learn ComplNet, we need manga images with text removed (ie output).
(I'm researching how an images with a small amount of text affects performance.
manga images with no text at all are the ideal data.)
Version 0.1.1 was trained using 285 image-mask pairs and 31,497 manga images.
(11,464 of 31,497 manga images are images with text.)
If you'd like to contribute a dataset to SickZil-Machine, please send your data to email .
The dataset will only be used for research purposes.
We released 0.1.1 pre-release version!
You can download SZMC here.
SickZil-Machine is not a perfect program. We need your help.
If you find a bug or have a suggestion, please open a Github issue or send us an email.
- Increase text segmentation performance
- Open manga text segmentation mask dataset
- Automate typesetting(calligraphy style learning)
English | 한국어
(출처: manga109, © Kanno Hiroshi, © Okuda Momoko, © Kato Masaki)
식질머신은 식자 작업에서 글자 제거 작업을 자동화합니다.
위 이미지들은 모두 사람의 개입 없이 자동으로 편집되었습니다.
(출처: manga109, © Shimazaki Yuzuru, © Akamatsu Ken, © Kobayashi Yuki)
식질머신은 만화에서 텍스트를 찾아내고, 자연스럽게 지워냅니다.
두 과정 모두 사람의 개입 없이 완전히 자동으로 진행됩니다.
물론 원한다면 지우고 싶은 영역을 지정할 수도 있습니다.
SegNet으로 U-net을 적용했고, ComplNet으로 Deepfill v2를 적용했습니다.
식질머신은 SegNet과 ComplNet 두개의 딥러닝 모델로 이루어집니다.
SegNet 학습을 위해서는 원본 만화 이미지와
원본에 대응하여 텍스트,효과음 영역을 가리키는 텍스트 컴포넌트 마스크가 필요합니다.
ComplNet 학습을 위해서는 텍스트가 제거된 만화 이미지(즉, 출력)가 필요합니다.
(텍스트가 약간 존재하는 이미지가 성능에 얼마나 영향을 미치는지는 연구 중입니다.
텍스트가 전혀 존재하지 않는 만화 이미지가 가장 이상적인 데이터이긴 합니다.)
0.1.1 버전은 이미지-마스크 285 쌍과 31,497개의 만화 이미지를 이용하여 학습하였습니다.
(31,497개의 만화 이미지 중 11,464개는 텍스트가 존재하는 이미지입니다.)
식질머신에 데이터셋을 기여하고 싶으시다면 이메일로 데이터를 보내주시면 됩니다.
데이터셋은 오직 연구 목적으로만 이용될 것입니다.
현재 0.1.1 pre-release 버전을 배포하고 있습니다!
여기서 다운로드할 수 있습니다.
현재 식질머신은 완벽하지 않습니다. 사용자 여러분의 도움이 필요합니다.
혹시 버그를 발견하셨거나 제안이 있으시다면 깃헙 이슈를 열어 제보해 주시거나 이메일을 보내주세요.
특히 이슈의 경우, 영어를 모르시면 그냥 한국어로 쓰셔도 됩니다.
- 만화 텍스트 세그멘테이션 성능 높이기
- 만화 텍스트 세그멘테이션 마스크 데이터셋 공개하기
- "식자" 자동화하기(손글씨 스타일 학습)