English | ็ฎไฝไธญๆ | ็น้ซไธญๆ | ํ๊ตญ์ด | Espaรฑol | ๆฅๆฌ่ช | เคนเคฟเคจเฅเคฆเฅ | ะ ัััะบะธะน | ะ ortuguรชs | เฐคเฑเฐฒเฑเฐเฑ | Franรงais | Deutsch | Tiแบฟng Viแปt | ุงูุนุฑุจูุฉ | ุงุฑุฏู |
๐ค Transformers๋ ํ ์คํธ, ๋น์ , ์ค๋์ค์ ๊ฐ์ ๋ค์ํ ๋ถ์ผ์์ ์ฌ๋ฌ ๊ณผ์ ๋ฅผ ์ํํ๋ ์์ฒ ๊ฐ์ ์ฌ์ ํ์ต๋ ๋ชจ๋ธ์ ์ ๊ณตํฉ๋๋ค.
์ ๊ณต๋๋ ๋ชจ๋ธ์ ํตํด ๋ค์ ๊ณผ์ ๋ฅผ ์ํํ ์ ์์ต๋๋ค.
- ๐ ํ ์คํธ: 100๊ฐ ์ด์์ ์ธ์ด๋ค๋ก, ํ ์คํธ ๋ถ๋ฅ, ์ ๋ณด ์ถ์ถ, ์ง๋ฌธ ๋ต๋ณ, ์์ฝ, ๋ฒ์ญ ๋ฐ ๋ฌธ์ฅ ์์ฑ
- ๐ผ๏ธ ์ด๋ฏธ์ง: ์ด๋ฏธ์ง ๋ถ๋ฅ(Image Classification), ๊ฐ์ฒด ํ์ง(Object Detection) ๋ฐ ๋ถํ (Segmentation)
- ๐ฃ๏ธ ์ค๋์ค: ์์ฑ ์ธ์(Speech Recognition) ๋ฐ ์ค๋์ค ๋ถ๋ฅ(Audio Classification)
Transformer์ ๋ชจ๋ธ์ ํ๋ฅผ ํตํ ์ง์์๋ต(Table QA), ๊ดํ ๋ฌธ์ ์ธ์(Optical Character Recognition), ์ค์บ ํ ๋ฌธ์์์ ์ ๋ณด ์ถ์ถ, ๋น๋์ค ๋ถ๋ฅ ๋ฐ ์๊ฐ์ ์ง์์๋ต๊ณผ ๊ฐ์ ์ฌ๋ฌ ๋ถ์ผ๊ฐ ๊ฒฐํฉ๋ ๊ณผ์ ๋ํ ์ํํ ์ ์์ต๋๋ค.
๐ค Transformers๋ ์ด๋ฌํ ์ฌ์ ํ์ต ๋ชจ๋ธ์ ๋น ๋ฅด๊ฒ ๋ค์ด๋ก๋ํด ํน์ ํ ์คํธ์ ์ฌ์ฉํ๊ณ , ์ํ๋ ๋ฐ์ดํฐ๋ก fine-tuningํด ์ปค๋ฎค๋ํฐ๋ ์ฐ๋ฆฌ์ ๋ชจ๋ธ ํ๋ธ์ ๊ณต์ ํ ์ ์๋๋ก API๋ฅผ ์ ๊ณตํฉ๋๋ค. ๋ํ, ๋ชจ๋ธ ๊ตฌ์กฐ๋ฅผ ์ ์ํ๋ ๊ฐ ํ์ด์ฌ ๋ชจ๋์ ์์ ํ ๋ ๋ฆฝ์ ์ด์ฌ์ ์ฐ๊ตฌ ์คํ์ ์ํด ์์ฝ๊ฒ ์์ ํ ์ ์์ต๋๋ค.
๐ค Transformers๋ ๊ฐ์ฅ ์ ๋ช ํ 3๊ฐ์ ๋ฅ๋ฌ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ง์ํฉ๋๋ค. ์ด๋ค์ ์๋ก ์๋ฒฝํ ์ฐ๋๋ฉ๋๋ค โ Jax, PyTorch, TensorFlow. ๊ฐ๋จํ๊ฒ ์ด ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ค ํ๋๋ก ๋ชจ๋ธ์ ํ์ตํ๊ณ , ๋ ๋ค๋ฅธ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ก ์ถ๋ก ์ ์ํด ๋ชจ๋ธ์ ๋ถ๋ฌ์ฌ ์ ์์ต๋๋ค.
๋๋ถ๋ถ์ ๋ชจ๋ธ์ ๋ชจ๋ธ ํ๋ธ ํ์ด์ง์์ ๋ฐ๋ก ํ ์คํธํด ๋ณผ ์ ์์ต๋๋ค. ๊ณต๊ฐ ๋ฐ ๋น๊ณต๊ฐ ๋ชจ๋ธ์ ์ํ ๋น๊ณต๊ฐ ๋ชจ๋ธ ํธ์คํ , ๋ฒ์ ๊ด๋ฆฌ, ์ถ๋ก API๋ ์ ๊ณตํฉ๋๋ค.
์๋ ๋ช ๊ฐ์ง ์์๊ฐ ์์ต๋๋ค:
์์ฐ์ด ์ฒ๋ฆฌ:
- BERT๋ก ๋ง์คํน๋ ๋จ์ด ์์ฑํ๊ธฐ
- Electra๋ฅผ ์ด์ฉํ ๊ฐ์ฒด๋ช ์ธ์
- GPT-2๋ก ํ ์คํธ ์์ฑํ๊ธฐ
- RoBERTa๋ก ์์ฐ์ด ์ถ๋ก ํ๊ธฐ
- BART๋ฅผ ์ด์ฉํ ์์ฝ
- DistilBERT๋ฅผ ์ด์ฉํ ์ง๋ฌธ ๋ต๋ณ
- T5๋ก ๋ฒ์ญํ๊ธฐ
์ปดํจํฐ ๋น์ :
- ViT์ ํจ๊ปํ๋ ์ด๋ฏธ์ง ๋ถ๋ฅ
- DETR๋ก ๊ฐ์ฒด ํ์งํ๊ธฐ
- SegFormer๋ก ์๋ฏธ์ ๋ถํ (semantic segmentation)ํ๊ธฐ
- Mask2Former๋ก ํ์ตํฑ ๋ถํ (panoptic segmentation)ํ๊ธฐ
- Depth Anything์ผ๋ก ๊น์ด ์ถ์ (depth estimation)ํ๊ธฐ
- VideoMAE์ ํจ๊ปํ๋ ๋น๋์ค ๋ถ๋ฅ
- OneFormer๋ก ์ ๋๋ฒ์ค ๋ถํ (universal segmentation)ํ๊ธฐ
์ค๋์ค:
- Whisper์ ํจ๊ปํ๋ ์๋ ์์ฑ ์ธ์
- Wav2Vec2๋ก ํค์๋ ๊ฒ์ถ(keyword spotting)ํ๊ธฐ
- Audio Spectrogram Transformer๋ก ์ค๋์ค ๋ถ๋ฅํ๊ธฐ
๋ฉํฐ ๋ชจ๋ฌ(Multimodal Task):
- TAPAS๋ก ํ ์์์ ์ง๋ฌธ ๋ต๋ณํ๊ธฐ
- ViLT์ ํจ๊ปํ๋ ์๊ฐ์ ์ง์์๋ต
- LLaVa๋ก ์ด๋ฏธ์ง์ ์ค๋ช ๋ฃ๊ธฐ
- SigLIP์ ํจ๊ปํ๋ ์ ๋ก ์ท(zero-shot) ์ด๋ฏธ์ง ๋ถ๋ฅ
- LayoutLM์ผ๋ก ๋ฌธ์ ์์์ ์ง๋ฌธ ๋ต๋ณํ๊ธฐ
- X-CLIP๊ณผ ํจ๊ปํ๋ ์ ๋ก ์ท(zero-shot) ๋น๋์ค ๋ถ๋ฅ
- OWLv2๋ก ์งํํ๋ ์ ๋ก ์ท(zero-shot) ๊ฐ์ฒด ํ์ง
- CLIPSeg๋ก ์งํํ๋ ์ ๋ก ์ท(zero-shot) ์ด๋ฏธ์ง ๋ถํ
- SAM๊ณผ ํจ๊ปํ๋ ์๋ ๋ง์คํฌ ์์ฑ
Transformer์ ๊ธ์ฐ๊ธฐ ๋ ์ด ์ ์ฅ์์ ํ ์คํธ ์์ฑ ๋ฅ๋ ฅ์ ๊ดํ Hugging Face ํ์ ๊ณต์ ๋ฐ๋ชจ์ ๋๋ค.
Transformers๋ ์ฌ์ ํ์ต๋ ๋ชจ๋ธ๋ค์ ์ด์ฉํ๋ ๋๊ตฌ๋ฅผ ๋์ด Transformers์ ํจ๊ป ๋น๋ ๋ ํ๋ก์ ํธ ๋ฐ Hugging Face Hub๋ฅผ ์ํ ํ๋์ ์ปค๋ฎค๋ํฐ์ ๋๋ค. ์ฐ๋ฆฌ๋ Transformers๋ฅผ ํตํด ๊ฐ๋ฐ์, ์ฐ๊ตฌ์, ํ์, ๊ต์, ์์ง๋์ด ๋ฐ ๋ชจ๋ ์ด๋ค์ด ๊ฟ์ ํ์ ํ๋ก์ ํธ(Dream Project)๋ฅผ ๋น๋ ํ ์ ์๊ธธ ๋ฐ๋๋๋ค.
Transformers์ ๋ฌ๋ฆฐ 100,000๊ฐ์ ๋ณ์ ์ถํํ๊ธฐ ์ํด, ์ฐ๋ฆฌ๋ ์ปค๋ฎค๋ํฐ๋ฅผ ์ฃผ๋ชฉํ๊ณ ์ Transformers๋ฅผ ํ๊ณ ๋น๋ ๋ 100๊ฐ์ ์ด๋ง์ด๋งํ ํ๋ก์ ํธ๋ค์ ์ ๋ณํ์ฌ awesome-transformers ํ์ด์ง์ ๋์ดํ์์ต๋๋ค.
๋ง์ผ ์์ ํ ํน์ ์ฌ์ฉํ๊ณ ๊ณ์ ํ๋ก์ ํธ๊ฐ ์ด ๋ฆฌ์คํธ์ ๊ผญ ๋ฑ์ฌ๋์ด์ผ ํ๋ค๊ณ ๋ฏฟ์ผ์ ๋ค๋ฉด, PR์ ์ด๊ณ ์ถ๊ฐํ์ฌ ์ฃผ์ธ์!
์กฐ์ง ์์์ AI ์ฌ์ฉ์ ๋ํด ์ง์งํ๊ฒ ๊ณ ๋ฏผ ์ค์ด์ ๊ฐ์? Hugging Face Enterprise Hub์ ํตํด ๋ ๋นจ๋ฆฌ ๊ตฌ์ถํด ๋ณด์ธ์.
์ฃผ์ด์ง ์
๋ ฅ(ํ
์คํธ, ์ด๋ฏธ์ง, ์ค๋์ค, ...)์ ๋ฐ๋ก ๋ชจ๋ธ์ ์ฌ์ฉํ ์ ์๋๋ก, ์ฐ๋ฆฌ๋ pipeline
API๋ฅผ ์ ๊ณตํฉ๋๋ค. Pipeline์ ์ฌ์ ํ์ต ๋ชจ๋ธ๊ณผ ๊ทธ ๋ชจ๋ธ์ ํ์ตํ ๋ ์ ์ฉํ ์ ์ฒ๋ฆฌ ๋ฐฉ์์ ํ๋๋ก ํฉ์นฉ๋๋ค. ๋ค์์ ๊ธ์ ์ ์ธ ํ
์คํธ์ ๋ถ์ ์ ์ธ ํ
์คํธ๋ฅผ ๋ถ๋ฅํ๊ธฐ ์ํด pipeline์ ์ฌ์ฉํ ๊ฐ๋จํ ์์์
๋๋ค:
>>> from transformers import pipeline
# ๊ฐ์ ๋ถ์ ํ์ดํ๋ผ์ธ์ ํ ๋นํ์ธ์
>>> classifier = pipeline('sentiment-analysis')
>>> classifier('We are very happy to introduce pipeline to the transformers repository.')
[{'label': 'POSITIVE', 'score': 0.9996980428695679}]
์ฝ๋์ ๋ ๋ฒ์งธ ์ค์ pipeline์ด ์ฌ์ฉํ๋ ์ฌ์ ํ์ต ๋ชจ๋ธ์ ๋ค์ด๋ก๋ํ๊ณ ์บ์๋ก ์ ์ฅํฉ๋๋ค. ์ธ ๋ฒ์งธ ์ค์์ ๊ทธ ๋ชจ๋ธ์ด ์ฃผ์ด์ง ํ ์คํธ๋ฅผ ํ๊ฐํฉ๋๋ค. ์ฌ๊ธฐ์ ๋ชจ๋ธ์ 99.97%์ ํ๋ฅ ๋ก ํ ์คํธ๊ฐ ๊ธ์ ์ ์ด๋ผ๊ณ ํ๊ฐํ์ต๋๋ค.
์์ฐ์ด ์ฒ๋ฆฌ(NLP) ๋ฟ๋ง ์๋๋ผ ์ปดํจํฐ ๋น์ , ๋ฐํ(Speech) ๊ณผ์ ๋ค์ ์ฌ์ ํ์ต๋ pipeline
์ผ๋ก ๋ฐ๋ก ์ํํ ์ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, ์ฌ์ง์์ ์์ฝ๊ฒ ๊ฐ์ฒด๋ค์ ํ์งํ ์ ์์ต๋๋ค.:
>>> import requests
>>> from PIL import Image
>>> from transformers import pipeline
# ๊ท์ฌ์ด ๊ณ ์์ด๊ฐ ์๋ ์ด๋ฏธ์ง๋ฅผ ๋ค์ด๋ก๋ํ์ธ์
>>> url = "https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/coco_sample.png"
>>> image_data = requests.get(url, stream=True).raw
>>> image = Image.open(image_data)
# ๊ฐ์ฒด ๊ฐ์ง๋ฅผ ์ํ ํ์ดํ๋ผ์ธ์ ํ ๋นํ์ธ์
>>> object_detector = pipeline('object-detection')
>>> object_detector(image)
[{'score': 0.9982201457023621,
'label': 'remote',
'box': {'xmin': 40, 'ymin': 70, 'xmax': 175, 'ymax': 117}},
{'score': 0.9960021376609802,
'label': 'remote',
'box': {'xmin': 333, 'ymin': 72, 'xmax': 368, 'ymax': 187}},
{'score': 0.9954745173454285,
'label': 'couch',
'box': {'xmin': 0, 'ymin': 1, 'xmax': 639, 'ymax': 473}},
{'score': 0.9988006353378296,
'label': 'cat',
'box': {'xmin': 13, 'ymin': 52, 'xmax': 314, 'ymax': 470}},
{'score': 0.9986783862113953,
'label': 'cat',
'box': {'xmin': 345, 'ymin': 23, 'xmax': 640, 'ymax': 368}}]
์์ ๊ฐ์ด, ์ฐ๋ฆฌ๋ ์ด๋ฏธ์ง์์ ํ์ง๋ ๊ฐ์ฒด๋ค์ ๋ํ์ฌ ๊ฐ์ฒด๋ฅผ ๊ฐ์ธ๋ ๋ฐ์ค์ ํ๋ฅ ๋ฆฌ์คํธ๋ฅผ ์ป์ ์ ์์ต๋๋ค. ์ผ์ชฝ์ด ์๋ณธ ์ด๋ฏธ์ง์ด๋ฉฐ ์ค๋ฅธ์ชฝ์ ํด๋น ์ด๋ฏธ์ง์ ํ์ง๋ ๊ฒฐ๊ณผ๋ฅผ ํ์ํ์์ต๋๋ค.
์ด ํํ ๋ฆฌ์ผ์์ pipeline
API๊ฐ ์ง์ํ๋ ๋ค์ํ ๊ณผ์ ๋ฅผ ํ์ธํ ์ ์์ต๋๋ค.
์ฝ๋ 3์ค๋ก ์ํ๋ ๊ณผ์ ์ ๋ง๊ฒ ์ฌ์ ํ์ต ๋ชจ๋ธ์ ๋ค์ด๋ก๋ ๋ฐ๊ณ ์ฌ์ฉํ ์ ์์ต๋๋ค. ๋ค์์ PyTorch ๋ฒ์ ์ ๋๋ค:
>>> from transformers import AutoTokenizer, AutoModel
>>> tokenizer = AutoTokenizer.from_pretrained("google-bert/bert-base-uncased")
>>> model = AutoModel.from_pretrained("google-bert/bert-base-uncased")
>>> inputs = tokenizer("Hello world!", return_tensors="pt")
>>> outputs = model(**inputs)
๋ค์์ TensorFlow ๋ฒ์ ์ ๋๋ค:
>>> from transformers import AutoTokenizer, TFAutoModel
>>> tokenizer = AutoTokenizer.from_pretrained("google-bert/bert-base-uncased")
>>> model = TFAutoModel.from_pretrained("google-bert/bert-base-uncased")
>>> inputs = tokenizer("Hello world!", return_tensors="tf")
>>> outputs = model(**inputs)
ํ ํฌ๋์ด์ ๋ ์ฌ์ ํ์ต ๋ชจ๋ธ์ ๋ชจ๋ ์ ์ฒ๋ฆฌ๋ฅผ ์ฑ ์์ง๋๋ค. ๊ทธ๋ฆฌ๊ณ (์์ ์์์ฒ๋ผ) 1๊ฐ์ ์คํธ๋ง์ด๋ ๋ฆฌ์คํธ๋ ์ฒ๋ฆฌํ ์ ์์ต๋๋ค. ํ ํฌ๋์ด์ ๋ ๋์ ๋๋ฆฌ๋ฅผ ๋ฐํํ๋๋ฐ, ์ด๋ ๋ค์ด์คํธ๋ฆผ ์ฝ๋์ ์ฌ์ฉํ๊ฑฐ๋ ์ธํจํน ์ฐ์ฐ์ ** ๋ฅผ ์ด์ฉํด ๋ชจ๋ธ์ ๋ฐ๋ก ์ ๋ฌํ ์๋ ์์ต๋๋ค.
๋ชจ๋ธ ์์ฒด๋ ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ฉ๋๋ Pytorch nn.Module
์ด๋ TensorFlow tf.keras.Model
์
๋๋ค. ์ด ํํ ๋ฆฌ์ผ์ ์ด๋ฌํ ๋ชจ๋ธ์ ํ์ค์ ์ธ PyTorch๋ TensorFlow ํ์ต ๊ณผ์ ์์ ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ, ๋๋ ์๋ก์ด ๋ฐ์ดํฐ๋ก ํ์ธ ํ๋ํ๊ธฐ ์ํด Trainer
API๋ฅผ ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ์ ์ค๋ช
ํด ์ค๋๋ค.
-
์์ฝ๊ฒ ์ฌ์ฉํ ์ ์๋ ์ต์ฒจ๋จ ๋ชจ๋ธ:
- ์์ฐ์ด ์ดํด(NLU)์ ์์ฑ(NLG), ์ปดํจํฐ ๋น์ , ์ค๋์ค ๊ณผ์ ์์ ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์ ๋๋ค.
- ๊ต์ก์์ ์ค๋ฌด์์๊ฒ ์ง์ ์ฅ๋ฒฝ์ด ๋ฎ์ต๋๋ค.
- 3๊ฐ์ ํด๋์ค๋ง ๋ฐฐ์ฐ๋ฉด ๋ฐ๋ก ์ฌ์ฉํ ์ ์์ต๋๋ค.
- ํ๋์ API๋ก ๋ชจ๋ ์ฌ์ ํ์ต ๋ชจ๋ธ์ ์ฌ์ฉํ ์ ์์ต๋๋ค.
-
๋ ์ ์ ๊ณ์ฐ ๋น์ฉ, ๋ ์ ์ ํ์ ๋ฐ์๊ตญ:
- ์ฐ๊ตฌ์๋ค์ ๋ชจ๋ธ์ ๊ณ์ ๋ค์ ํ์ต์ํค๋ ๋์ ํ์ต๋ ๋ชจ๋ธ์ ๊ณต์ ํ ์ ์์ต๋๋ค.
- ์ค๋ฌด์๋ค์ ํ์ต์ ํ์ํ ์๊ฐ๊ณผ ๋น์ฉ์ ์ ์ฝํ ์ ์์ต๋๋ค.
- ๋ชจ๋ ๋ถ์ผ๋ฅผ ํตํ์ด์ 400,000๊ฐ ์ด์์ ์ฌ์ ํ์ต๋ ๋ชจ๋ธ์ด ์๋ ์์ญ ๊ฐ์ ์ํคํ ์ฒ.
-
๋ชจ๋ธ์ ๊ฐ ์์ ์ฃผ๊ธฐ์ ์ ํฉํ ํ๋ ์์ํฌ:
- ์ฝ๋ 3์ค๋ก ์ต์ฒจ๋จ ๋ชจ๋ธ์ ํ์ตํ์ธ์.
- ๋ชฉ์ ์ ์๋ง๊ฒ ๋ชจ๋ธ์ TF2.0/Pytorch/Jax ํ๋ ์ ์ํฌ ์ค ํ๋๋ก ์ด๋์ํค์ธ์.
- ํ์ต, ํ๊ฐ, ๊ณต๊ฐ ๋ฑ ๊ฐ ๋จ๊ณ์ ๋ง๋ ํ๋ ์์ํฌ๋ฅผ ์ํ๋๋๋ก ์ ํํ์ธ์.
-
ํ์ํ ๋๋ก ๋ชจ๋ธ์ด๋ ์์๋ฅผ ์ปค์คํฐ๋ง์ด์ฆํ์ธ์:
- ์ฐ๋ฆฌ๋ ์ ์๊ฐ ๊ณต๊ฐํ ๊ฒฐ๊ณผ๋ฅผ ์ฌํํ๊ธฐ ์ํด ๊ฐ ๋ชจ๋ธ ๊ตฌ์กฐ์ ์์๋ฅผ ์ ๊ณตํฉ๋๋ค.
- ๋ชจ๋ธ ๋ด๋ถ ๊ตฌ์กฐ๋ ๊ฐ๋ฅํ ์ผ๊ด์ ์ผ๋ก ๊ณต๊ฐ๋์ด ์์ต๋๋ค.
- ๋น ๋ฅธ ์คํ์ ์ํด ๋ชจ๋ธ ํ์ผ์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ๋ ๋ฆฝ์ ์ผ๋ก ์ฌ์ฉ๋ ์ ์์ต๋๋ค.
- ์ด ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ ์ ๊ฒฝ๋ง ๋ธ๋ก์ ๋ง๋ค๊ธฐ ์ํ ๋ชจ๋์ด ์๋๋๋ค. ์ฐ๊ตฌ์๋ค์ด ์ฌ๋ฌ ํ์ผ์ ์ดํด๋ณด์ง ์๊ณ ๋ฐ๋ก ๊ฐ ๋ชจ๋ธ์ ์ฌ์ฉํ ์ ์๋๋ก, ๋ชจ๋ธ ํ์ผ ์ฝ๋์ ์ถ์ํ ์์ค์ ์ ์ ํ๊ฒ ์ ์งํ์ต๋๋ค.
- ํ์ต API๋ ๋ชจ๋ ๋ชจ๋ธ์ ์ ์ฉํ ์ ์๋๋ก ๋ง๋ค์ด์ง์ง ์์์ง๋ง, ๋ผ์ด๋ธ๋ฌ๋ฆฌ๊ฐ ์ ๊ณตํ๋ ๋ชจ๋ธ๋ค์ ์ ์ฉํ ์ ์๋๋ก ์ต์ ํ๋์์ต๋๋ค. ์ผ๋ฐ์ ์ธ ๋จธ์ ๋ฌ๋์ ์ํด์ , ๋ค๋ฅธ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ฌ์ฉํ์ธ์(์๋ฅผ ๋ค๋ฉด, Accelerate).
- ๊ฐ๋ฅํ ๋ง์ ์ฌ์ฉ ์์๋ฅผ ๋ณด์ฌ๋๋ฆฌ๊ณ ์ถ์ด์, ์์ ํด๋์ ์คํฌ๋ฆฝํธ๋ฅผ ์ค๋นํ์ต๋๋ค. ์ด ์คํฌ๋ฆฝํธ๋ค์ ์์ ์์ด ํน์ ํ ๋ฌธ์ ์ ๋ฐ๋ก ์ ์ฉํ์ง ๋ชปํ ์ ์์ต๋๋ค. ํ์์ ๋ง๊ฒ ์ผ๋ถ ์ฝ๋๋ฅผ ์์ ํด์ผ ํ ์ ์์ต๋๋ค.
์ด ์ ์ฅ์๋ Python 3.9+, Flax 0.4.1+, PyTorch 2.0+, TensorFlow 2.6+์์ ํ ์คํธ ๋์์ต๋๋ค.
๊ฐ์ ํ๊ฒฝ์ ๐ค Transformers๋ฅผ ์ค์นํ์ธ์. Python ๊ฐ์ ํ๊ฒฝ์ ์ต์ํ์ง ์๋ค๋ฉด, ์ฌ์ฉ์ ๊ฐ์ด๋๋ฅผ ํ์ธํ์ธ์.
์ฐ์ , ์ฌ์ฉํ Python ๋ฒ์ ์ผ๋ก ๊ฐ์ ํ๊ฒฝ์ ๋ง๋ค๊ณ ์คํํ์ธ์.
๊ทธ ๋ค์, Flax, PyTorch, TensorFlow ์ค ์ ์ด๋ ํ๋๋ ์ค์นํด์ผ ํฉ๋๋ค. ํ๋ซํผ์ ๋ง๋ ์ค์น ๋ช ๋ น์ด๋ฅผ ํ์ธํ๊ธฐ ์ํด TensorFlow ์ค์น ํ์ด์ง, PyTorch ์ค์น ํ์ด์ง, Flax ์ค์น ํ์ด์ง๋ฅผ ํ์ธํ์ธ์.
์ด๋ค ์ค ์ ์ด๋ ํ๋๊ฐ ์ค์น๋์๋ค๋ฉด, ๐ค Transformers๋ ๋ค์๊ณผ ๊ฐ์ด pip์ ์ด์ฉํด ์ค์นํ ์ ์์ต๋๋ค:
pip install transformers
์์๋ค์ ์ฒดํํด๋ณด๊ณ ์ถ๊ฑฐ๋, ์ต์ต์ต์ฒจ๋จ ์ฝ๋๋ฅผ ์ํ๊ฑฐ๋, ์๋ก์ด ๋ฒ์ ์ด ๋์ฌ ๋๊น์ง ๊ธฐ๋ค๋ฆด ์ ์๋ค๋ฉด ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์์ค์์ ๋ฐ๋ก ์ค์นํ์ ์ผ ํฉ๋๋ค.
๐ค Transformers๋ ๋ค์๊ณผ ๊ฐ์ด conda๋ก ์ค์นํ ์ ์์ต๋๋ค:
conda install conda-forge::transformers
๋ ธํธ:
huggingface
์ฑ๋์์transformers
๋ฅผ ์ค์นํ๋ ๊ฒ์ ์ฌ์ฉ์ด ์ค๋จ๋์์ต๋๋ค.
Flax, PyTorch, TensorFlow ์ค์น ํ์ด์ง์์ ์ด๋ค์ conda๋ก ์ค์นํ๋ ๋ฐฉ๋ฒ์ ํ์ธํ์ธ์.
๋ ธํธ: ์๋์ฐ ํ๊ฒฝ์์ ์บ์ฑ์ ์ด์ ์ ์ํด ๊ฐ๋ฐ์ ๋ชจ๋๋ฅผ ํ์ฑํํ ์ ์์ต๋๋ค. ๋ง์ฝ ์ฌ๋ฌ๋ถ์๊ฒ ์์ด์ ์ ํ์ด ์๋ ํ์๋ผ๋ฉด ์ด ์ด์๋ฅผ ํตํด ์๋ ค์ฃผ์ธ์.
๐ค Transformers๊ฐ ์ ๊ณตํ๋ ๋ชจ๋ ๋ชจ๋ธ ์ฒดํฌํฌ์ธํธ ๋ huggingface.co ๋ชจ๋ธ ํ๋ธ์ ์๋ฒฝํ ์ฐ๋๋์ด ์์ต๋๋ค. ๊ฐ์ธ๊ณผ ๊ธฐ๊ด์ด ๋ชจ๋ธ ํ๋ธ์ ์ง์ ์ ๋ก๋ํ ์ ์์ต๋๋ค.
ํ์ฌ ์ฌ์ฉ ๊ฐ๋ฅํ ๋ชจ๋ธ ์ฒดํฌํฌ์ธํธ์ ๊ฐ์:
๐ค Transformers๋ ๋ค์ ๋ชจ๋ธ๋ค์ ์ ๊ณตํฉ๋๋ค: ๊ฐ ๋ชจ๋ธ์ ์์ฝ์ ์ฌ๊ธฐ์ ํ์ธํ์ธ์.
๊ฐ ๋ชจ๋ธ์ด Flax, PyTorch, TensorFlow์ผ๋ก ๊ตฌํ๋์๋์ง ๋๋ ๐ค Tokenizers ๋ผ์ด๋ธ๋ฌ๋ฆฌ๊ฐ ์ง์ํ๋ ํ ํฌ๋์ด์ ๋ฅผ ์ฌ์ฉํ๋์ง ํ์ธํ๋ ค๋ฉด, ์ด ํ๋ฅผ ํ์ธํ์ธ์.
์ด ๊ตฌํ์ ์ฌ๋ฌ ๋ฐ์ดํฐ๋ก ๊ฒ์ฆ๋์๊ณ (์์ ์คํฌ๋ฆฝํธ๋ฅผ ์ฐธ๊ณ ํ์ธ์) ์ค๋ฆฌ์ง๋ ๊ตฌํ์ ์ฑ๋ฅ๊ณผ ๊ฐ์์ผ ํฉ๋๋ค. ๋ํ๋จผํธ์ Examples ์น์ ์์ ์ฑ๋ฅ์ ๋ํ ์์ธํ ์ค๋ช ์ ํ์ธํ ์ ์์ต๋๋ค.
์น์ | ์ค๋ช |
---|---|
๋ํ๋จผํธ | ์ ์ฒด API ๋ํ๋จผํธ์ ํํ ๋ฆฌ์ผ |
๊ณผ์ ์์ฝ | ๐ค Transformers๊ฐ ์ง์ํ๋ ๊ณผ์ ๋ค |
์ ์ฒ๋ฆฌ ํํ ๋ฆฌ์ผ | Tokenizer ํด๋์ค๋ฅผ ์ด์ฉํด ๋ชจ๋ธ์ ์ํ ๋ฐ์ดํฐ ์ค๋นํ๊ธฐ |
ํ์ต๊ณผ ํ์ธ ํ๋ | ๐ค Transformers๊ฐ ์ ๊ณตํ๋ ๋ชจ๋ธ PyTorch/TensorFlow ํ์ต ๊ณผ์ ๊ณผ Trainer API์์ ์ฌ์ฉํ๊ธฐ |
ํต ํฌ์ด: ํ์ธ ํ๋/์ฌ์ฉ ์คํฌ๋ฆฝํธ | ๋ค์ํ ๊ณผ์ ์์ ๋ชจ๋ธ์ ํ์ธ ํ๋ํ๋ ์์ ์คํฌ๋ฆฝํธ |
๋ชจ๋ธ ๊ณต์ ๋ฐ ์ ๋ก๋ | ์ปค๋ฎค๋ํฐ์ ํ์ธ ํ๋๋ ๋ชจ๋ธ์ ์ ๋ก๋ ๋ฐ ๊ณต์ ํ๊ธฐ |
๐ค Transformers ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ธ์ฉํ๊ณ ์ถ๋ค๋ฉด, ์ด ๋ ผ๋ฌธ์ ์ธ์ฉํด ์ฃผ์ธ์:
@inproceedings{wolf-etal-2020-transformers,
title = "Transformers: State-of-the-Art Natural Language Processing",
author = "Thomas Wolf and Lysandre Debut and Victor Sanh and Julien Chaumond and Clement Delangue and Anthony Moi and Pierric Cistac and Tim Rault and Rรฉmi Louf and Morgan Funtowicz and Joe Davison and Sam Shleifer and Patrick von Platen and Clara Ma and Yacine Jernite and Julien Plu and Canwen Xu and Teven Le Scao and Sylvain Gugger and Mariama Drame and Quentin Lhoest and Alexander M. Rush",
booktitle = "Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing: System Demonstrations",
month = oct,
year = "2020",
address = "Online",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/2020.emnlp-demos.6",
pages = "38--45"
}