Skip to content

Latest commit

ย 

History

History
169 lines (101 loc) ยท 8.09 KB

README.md

File metadata and controls

169 lines (101 loc) ยท 8.09 KB

๐Ÿ–ฅ๏ธ hackathon_abled

AI ๊ธฐ๋ฐ˜ ์žฅ์• ์ธ ๊ณ ์šฉ ๋งค์นญ ์„œ๋น„์Šค: โ€œAbledโ€ ์•ฑ ๊ฐœ๋ฐœ

๐Ÿ‘ Team Members ๐Ÿ‘

์ด๋ฆ„ ์—ญํ• 
๋‚จ๊ฒฝํ˜„ ๋ฐ์ดํ„ฐ๋ถ„์„ ,์•„์ด๋””์–ด ๊ธฐํš
์ตœ์—ฐ์•„ ๋ฐ์ดํ„ฐ๋ถ„์„ ,AI๋ชจ๋ธ ๋นŒ๋”ฉ
์„ฑํ˜ธ์ • UI/UX ์„ค๊ณ„ ,ํ”„๋กœํ† ํƒ€์ž… ๊ฐœ๋ฐœ
์ž„ํ˜•์ค€ ์•ฑ ๊ฐœ๋ฐœ ,ํ”„๋กœํ† ํƒ€์ž… ๊ฐœ๋ฐœ

๐Ÿ›๏ธ system architecture ๐Ÿ›๏ธ

image

โœจ Data analysis Flow chart โœจ

  • ๊ณต๊ณต๋ฐ์ดํ„ฐ ํฌํ„ธ / ํ•œ๊ตญ์žฅ์• ์ธ๊ณ ์šฉ๊ณต๋‹จ_์žฅ์• ์ธ ์ทจ์—… ์ •๋ณด - https://www.data.go.kr/data/15088956/fileData.do
  • ๊ณต๊ณต๋ฐ์ดํ„ฐ ํฌํ„ธ / ํ•œ๊ตญ์žฅ์• ์ธ๊ณ ์šฉ๊ณต๋‹จ_์žฅ์• ์ธ ๊ตฌ์ง์ž ํ˜„ํ™ฉ - https://www.data.go.kr/data/15088956/fileData.do
  • ๊ณต๊ณต๋ฐ์ดํ„ฐ ํฌํ„ธ / ํ•œ๊ตญ์žฅ์• ์ธ๊ณ ์šฉ๊ณต๋‹จ_์žฅ์• ์ธ ๊ตฌ์ธ ์ •๋ณด - https://www.data.go.kr/data/3072637/fileData.do
  • ๊ณต๊ณต๋ฐ์ดํ„ฐ ํฌํ„ธ / ํ•œ๊ตญ์žฅ์• ์ธ๊ณ ์šฉ๊ณต๋‹จ_์žฅ์• ์ธ ๊ตฌ์ธ ์‹ค์‹œ๊ฐ„ ํ˜„ํ™ฉ - https://www.data.go.kr/data/15117692/openapi.do

โœจ Data preprocessing โœจ

  1. ํฌ๋ง์ง์ข… ์ „์ฒ˜๋ฆฌ

    • ์ž์นด๋“œ ์œ ์‚ฌ๋„๋ฅผ ์ ์šฉํ•˜์—ฌ ํฌ๋ง์ง์ข…์„ 16๊ฐœ ์นดํ…Œ๊ณ ๋ฆฌ๋กœ ํ†ต์ผ
  2. ๊ทผ๋กœ์ง€์—ญ ์ „์ฒ˜๋ฆฌ

    • ์„ธ๋ถ„ํ™” ๋œ ๊ทผ๋กœ์ง€์—ญ์„ ์ง€์—ญ๋ณ„๋กœ ๋ถ„์„์„ ์šฉ์ดํ•˜๊ฒŒ ํ•˜๊ธฐ ์œ„ํ•ด ๋„ ๊ถŒ์—ญ ๋‹จ์œ„๋กœ ๋Š์–ด์„œ ์ง„ํ–‰

โœจ Exploratory Data Analysis โœจ

image image

๐Ÿ“ˆ AutoML Flow chart ๐Ÿ“ˆ

  1. Pycaret ์„ค์น˜

    • ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ์„ค์น˜ ๋ฐ ๋ฐ์ดํ„ฐ ์ž„ํฌํŠธ
  2. ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ

    • ๋ฐ์ดํ„ฐ๊ฐ€ 2๊ฐœ ๋ฟ์ธ โ€˜์ธ๋ฌธ-์‚ฌํšŒ๊ณผํ•™ ์—ฐ๊ตฌ์ง', ์ž์—ฐ-์ƒ๋ช…๊ณผํ•™ ์—ฐ๊ตฌ์ง' ๋ฐ์ดํ„ฐ ์‚ญ์ œ
    • 45,117 rows x 5 columns ๋ฐ์ดํ„ฐ ํ™•์ธ
  3. ๋ชจ๋ธ ์ƒ์„ฑ

  • ๋ถ„๋ฅ˜/ํšŒ๊ท€/๊ตฐ์ง‘์—๋”ฐ๋ผ์„œ ์ƒ์„ฑํ•˜๋Š” ๋ชจ๋ธ ์ƒ์ด
  • ๋ถ„๋ฅ˜ ๋ชจ๋ธ์ค‘ ์„ฑ๋Šฅ์ด ์ข‹์€ ๋ชจ๋ธ์ธ RF ๋ชจ๋ธ ์ƒ์„ฑ (๊ณต์‹๋ฌธ์„œ ์ฐธ์กฐ)
  • fold โ†’ ๋ฐ์ดํ„ฐ์…‹์„ 5๊ฐœ๋กœ ๋‚˜๋ˆ„์–ด ๊ต์ฐจ ๊ฒ€์ฆ
  1. ๋ชจ๋ธ ์„ฑ๋Šฅ ๋น„๊ต
  • 15๊ฐœ์˜ ML๋ชจ๋ธ -> ํ‰๊ฐ€์ง€ํ‘œ๋ณ„ ์„ฑ๋Šฅ ๋น„๊ต ํ›„ ํ‰๊ฐ€
  • ๊ฐ๊ฐ ๋ชจ๋ธ๋“ค์„ acc๋ฅผ ๊ธฐ์ค€์œผ๋กœ ์ƒ์œ„ 3๊ฐœ ๋ชจ๋ธ top3์— ์ €์žฅ
  1. ๋ชจ๋ธ ํŠœ๋‹ ๋ฐ ์•™์ƒ๋ธ”
image
- Gradient Boosting Classifier + Extreme Gradient Boosting + Logistic Regression -> Voting Classifier

  1. ์ตœ์ข…๋ชจ๋ธ
  • ํ•™์Šต ๋ฐ์ดํ„ฐ ๋ถˆ๊ท ํ˜•์œผ๋กœ ์ผ์–ด๋‚˜๋Š” ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ์ƒ์œ„ 10๊ฐœ ์ง์—…๊ตฐ์˜ ํ•™์Šต ๋ฐ์ดํ„ฐ์ˆ˜ undersampling, oversampling ์ง„ํ–‰
image

โค๏ธโ€๐Ÿฉน ์ผ์ž๋ฆฌ ์ถ”์ฒœ ์œ ์ € ํ…Œ์ŠคํŠธ โค๏ธโ€๐Ÿฉน

image image

๐Ÿ‘ ๊ฐ€์žฅ ๋†’์€ ํ™•๋ฅ ์„ ๊ฐ€์ง€๋Š” ์ผ์ž๋ฆฌ ์ถ”์ฒœ ๐Ÿ‘

image

๐ŸŽฌ ์„ธ๋ถ€ ์ง๋ฌด ์„ค๋ช… ์˜์ƒ ์ œ์ž‘ ๐ŸŽฌ

Model

image
Diffussion generation model ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๋Š”
Sora๋Š” OpenAI์—์„œ ๊ณต๊ฐœ๋œ ๋ชจ๋ธ๋กœ, ์žก์Œ์ด ์žˆ๋Š” ํŒจ์น˜๋ฅผ ์ž…๋ ฅ์œผ๋กœ ๋ฐ›์•„ ๊นจ๋—ํ•œ ํŒจ์น˜๋ฅผ ์˜ˆ์ธกํ•˜๋„๋ก ํ›ˆ๋ จ๋ฐ›์Œ.
ํŠนํžˆ, Sora๋Š” diffusion transformers ์ด๋ฏ€๋กœ ์–ธ์–ด ๋ชจ๋ธ๋ง, ์ปดํ“จํ„ฐ ๋น„์ „ , ์ด๋ฏธ์ง€ ์ƒ์„ฑ๊ณผ ๊ฐ™์€ ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์—์„œ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์คŒ.

์˜์ƒ ์ œ์ž‘ Flow

  1. ์‹ค์‹œ๊ฐ„ API
    • โ€˜ํ•œ๊ตญ์žฅ์• ์ธ๊ณ ์šฉ๊ณต๋‹จ ์žฅ์• ์ธ ๊ตฌ์ธ ์‹ค์‹œ๊ฐ„ ํ˜„ํ™ฉ APIโ€™์—์„œ ํ•„์š”ํ•œ ์ง๋ฌด ๊ธฐ๋Šฅ์ด ๋“ค์–ด๊ฐ„ ํ‚ค์›Œ๋“œ ๋ฐœ์ทŒ
    image

  1. ํ…์ŠคํŠธ ์ „์ฒ˜๋ฆฌ
    • ๋ฐœ์ทŒํ•œ ์ง๋ฌด ๊ธฐ๋Šฅ ํ‚ค์›Œ๋“œ๋ฅผ Gpt 3.5 api๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ Sora์˜ ํ”„๋กฌํ”„ํŠธ์— ์•Œ๋งž๊ฒŒ ํŠœ๋‹ํ•˜๋Š” ์ „์ฒ˜๋ฆฌ๋ฅผ ๊ฑฐ์นจ
    image

  1. Sora์— ์ž…๋ ฅ
    • Sora์— ํ”„๋กฌํ”„ํŠธ๋ฅผ ์ž…๋ ฅํ•ด ์˜์ƒ์„ ์ œ์ž‘

  1. ์ง๋ฌด ์˜์ƒ ์ œ๊ณต (ํ˜„์žฌ Sora api๋Š” ๋น„๊ณต๊ฐœ์ด๊ธฐ ๋•Œ๋ฌธ์— โ€˜Flikiโ€™ ์ƒ์„ฑํ˜• AI ๋น„๋””์˜ค ํˆด ์ด์šฉํ•ด์„œ ์ง์ ‘ ์ œ์ž‘ )

๐ŸŽค ์Œ์„ฑ์ธ์‹ ๊ธฐ๋Šฅ ์„ค๊ณ„ ๐ŸŽค

์‚ฌ์šฉ์ž๋Š” ์Œ์„ฑ ์ธ์‹ ๊ธฐ๋Šฅ์„ ์ด์šฉํ•˜์—ฌ ์‰ฝ๊ฒŒ ์›ํ•˜๋Š” ํŽ˜์ด์ง€์— ์ ‘๊ทผํ•  ์ˆ˜ ์žˆ์Œ. ๊ตฌํ˜„ Process๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์Œ.

  1. ์„œ๋ฒ„์— ๊ฐ ํŽ˜์ด์ง€์˜ ์ œ๋ชฉ, ๊ธฐ๋Šฅ ๋“ฑ์„ ํฌํ•จํ•˜๋Š” Description ์ฝ”๋“œ๋ฅผ ์ž‘์„ฑ.
  2. ์•ˆ๋“œ๋กœ์ด๋“œ ์Œ์„ฑ ์ธ์‹ ๊ธฐ๋Šฅ์„ ์ด์šฉํ•˜์—ฌ ์‚ฌ์šฉ์ž์˜ ์Œ์„ฑ Data๋ฅผ ํ…์ŠคํŠธ๋กœ ๋ณ€ํ™˜ํ•˜์—ฌ ์„œ๋ฒ„์— ์ „์†ก.
  3. ์„œ๋ฒ„๋Š” ์‚ฌ์šฉ์ž์˜ ์Œ์„ฑ ํ…์ŠคํŠธ์™€ Description์˜ ์ฝ”์‚ฌ์ธ ์œ ์‚ฌ๋„๋ฅผ ๋น„๊ตํ•˜์—ฌ ๊ฐ€์žฅ ์œ ์‚ฌ๋„๊ฐ€ ๋†’์€ ํŽ˜์ด์ง€๋ฅผ ์ œ๊ณต.

๊ฒฐ๊ณผ ์˜ˆ์‹œ
image image

๐Ÿ“• ํ”ผ๊ทธ๋งˆ ์•ฑ ํ”„๋กœํ† ํƒ€์ž… ์„ค๊ณ„ ๐Ÿ“•

  1. ์‚ฌ์šฉ์ž๋Š” ์ž์‹ ์˜ ์—ฐ๋ น, ์žฅ์• ์œ ํ˜•, ์ค‘์ฆ์—ฌ๋ถ€, ๊ทผ๋ฌด์ง€์—ญ ์ž…๋ ฅ์„ ์ž…๋ ฅํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์‚ฌ์šฉ์ž๋ฅผ ๊ณ ๋ คํ•ด ์ง๊ด€์ ์ด๊ณ  ํ•œ๋ˆˆ์— ๋ณผ์ˆ˜์žˆ๋Š” UI๋ฅผ ๋„์ž…ํ•˜์˜€์Šต๋‹ˆ๋‹ค.
image
  1. AutoML ๊ธฐ๋ฐ˜์˜ AI ๋ชจ๋ธ์„ ํ†ตํ•ด ๊ฐ€์žฅ ๋†’์€ ํ™•๋ฅ ์„ ๊ฐ€์ง„ ๋งž์ถคํ˜• ์ง์—… ์ถ”์ฒœ์„ ํ•ด์ค๋‹ˆ๋‹ค. ์‹œ๊ฐํ™” ์ž๋ฃŒ ๋˜ํ•œ ์ œ๊ณตํ•˜๋ฉฐ ์‹ค์‹œ๊ฐ„ API๋ฅผ ํ†ตํ•ด ๋งž์ถคํ˜• ๊ณต๊ณ ๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.
image
  1. ํ™ˆํŽ˜์ด์ง€ ๋˜ํ•œ ์‚ฌ์šฉ์ž๋ฅผ ๊ณ ๋ คํ•˜์—ฌ ์‰ฝ๊ณ  ์ง๊ด€์ ์ธ UI๋ฅผ ๋„์ž…ํ•˜์˜€์Šต๋‹ˆ๋‹ค. ์ผ์ž๋ฆฌ ์ฐพ๊ธฐ , ์ปค๋ฎค๋‹ˆํ‹ฐ , ์žฅ์• ์œ ํ˜•๋ณ„ ๊ณ ์šฉํ˜„ํ™ฉ์„ ๋ณผ ์ˆ˜ ์žˆ์œผ๋ฉฐ ์ปค๋ฎค๋‹ˆํ‹ฐ๋ฅผ ์‚ฌ์šฉํ•˜๊ธฐ ์œ„ํ•œ ํšŒ์›๊ฐ€์ž…/๋กœ๊ทธ์ธ ๋กœ์ง์„ ๊ตฌํ˜„ํ•˜์˜€์Šต๋‹ˆ๋‹ค.
image
  1. ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ์™€ STT ๊ธฐ์ˆ ์„ UI์— ๋„์ž…ํ•˜์—ฌ, ์‚ฌ์šฉ์ž๊ฐ€ ์š”๊ตฌํ•˜๋Š” ํŽ˜์ด์ง€๋ฅผ ์ง๊ด€์ ์œผ๋กœ ์ œ๊ณตํ•จ์œผ๋กœ ๋ณด๋‹ค ์‰ฝ๊ฒŒ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๊ณ , ์‹ ์ฒด์ ์œผ๋กœ ๋ถˆํŽธํ•œ ์žฅ์• ์ธ๋“ค์˜ ์„ ํƒ์ง€๊ฐ€ ๋Š˜์–ด๋‚  ์ˆ˜ ์žˆ๊ฒŒ ๊ตฌํ˜„ํ•˜์˜€์Šต๋‹ˆ๋‹ค.
image
  1. ์ปค๋ฎค๋‹ˆํ‹ฐ ํŽ˜์ด์ง€์ž…๋‹ˆ๋‹ค. ์ปค๋ฎค๋‹ˆํ‹ฐ ํŽ˜์ด์ง€๋Š” ์งˆ๋ฌธ๊ฒŒ์‹œํŒ, ์ •๋ณด ๊ณต์œ  ๊ฒŒ์‹œํŒ, ๊ธ‰ํ•œ ๊ตฌ์ธ ๊ฒŒ์‹œํŒ์œผ๋กœ ๋‚˜๋ˆ„์–ด์ ธ์žˆ์œผ๋ฉฐ ์‚ฌ์šฉ์ž๋“ค์ด ํŽธํ•˜๊ฒŒ ์ž์‹ ๋“ค์˜ ์ด์•ผ๊ธฐ๋ฅผ ํ•˜๊ณ  ์ •๋ณด๋ฅผ ๊ณต์œ ํ•  ์ˆ˜ ์žˆ๋„๋ก ๊ธฐ๋Šฅ์— ๋”ฐ๋ผ ์„ค๊ณ„ํ•˜์˜€์Šต๋‹ˆ๋‹ค.
image

ํ”„๋กœํ† ํƒ€์ž… ์‹œ์—ฐ ์˜์ƒ

https://www.youtube.com/shorts/kd3qTiy557I

๐Ÿ‘ฉโ€๐Ÿ’ป ์•ˆ๋“œ๋กœ์ด๋“œ ์ŠคํŠœ๋””์˜ค ๊ฐœ๋ฐœ ํŒŒ์ดํ”„๋ผ์ธ ๐Ÿ‘ฉโ€๐Ÿ’ป

image