- Leader Board Score(1st)

μ£Όμ΅ : HDνκ΅μ‘°μ ν΄μ AI Center
μ£Όκ΄ : DACON
κ·λͺ¨ : μ΄ 1320μ¬λͺ μ°Έκ° μ€ μ΅μ’ μμ 11ν λ³Έμ μ§μΆ ν μ§νλ λ³Έμ λν
==========================================================
βοΈ
λν λλμ
μ΄λ² λ³Έμ λνλ μ½ 3μΌκ°μ 짧μ κΈ°κ°μΌλ‘ μ§νλμλλ°
λ¨Όμ λλ μκ°μ μ λ§ νν μμ΄ μ΄μ¬ν νλ€κ³ μκ°ν©λλ€.
λͺ¨λΈλ 3μΌμ΄λΌλ μκ°λμ μ΄ 400λ² μ μΆμ΄ κ°λ₯νλλ°
νΌμ 380λ² μ΄μμ μ μΆνμμ΅λλ€.
μ λ§ μ΄μ¬ν νμκ³ λ§μ§λ§λ μλ μ½λ©νλ€κ° μ½νΌλ μ¬λ¬λ² λ¬μμ΅λλ€..
μ΄λ² λνλ λνμ λ°°κ²½μ λ°λ₯Έ κ°μ€ μ€μ μ μ΄μ μΌλ‘ μ§ννμ΅λλ€.
λ°λΌμ μ€μ νλ κ°μ€λ‘ λͺ¨λΈλ§μ μ§ννλλ°,
κ·Έ κ°μ€μ΄ λ§μκΈ° λλ¬Έμ μλ§ λ¦¬λ보λ(λͺ¨λΈ μ νλ) λνΉλ 1λ±μ΄μ§ μμμκΉ λΌκ³ μκ°νλ©°
λ³Έμ λ°ν νκ° λ μ¬μ¬μμλΆλ€κ» μ μ€λμ΄ λμ§ μμλ λΌκ³ μκ°ν©λλ€.
**μ κ·Όλ²** μ΄ λνλ κ±΄μ€ νμ₯μμ νλ¦Ώ 맀λμ§λ¨ΌνΈ μ루μ μ νμμ±μ λ§μΆ° μ΅μ νλ μ₯λΉ μ‘°ν©μ μ°Ύλ κ²μ΄ λͺ©νμμ΅λλ€. μ₯λΉμ μμ λμ μμΈ‘νλ κ³Όμ μμ, μμ μλ§λ€ λ°μ΄ν° ν¨ν΄μ΄ λ¬λΌ λ Έμ΄μ¦κ° λ°μνλλ°, μ΄λ μμ μμ μ±ν₯, μλ₯Ό λ€μ΄ μλ¨λ¦Όμ΄λ νΉμ μ΅κ΄ λ±μ μν κ²μ΄λΌκ³ νλ¨νμ΅λλ€. μ΄λ¬ν μν₯μ λ°μ§ μλ λͺ¨λΈμ κ°λ°νκΈ° μν΄ μ¬λ¬ Step Sizeλ₯Ό νμ©ν΄ μΌλ°ν μ±λ₯μ λμμ΅λλ€. μ΄ μμ΄λμ΄λ μκ³μ΄ λͺ¨λΈμμ μλμ° μ¬μ΄μ¦λ₯Ό ν΅ν μμλΈ ν¨κ³Όμ λΆνΈμ€νΈλν κΈ°λ²μ μ μ©ν κ²μ λλ€. λ°μ΄ν°λ λΉμλ³νλμ΄ μμμ§λ§, EDAλ₯Ό ν΅ν΄ μ΄λ₯Ό κ΅΄μ°©κΈ°λ‘ κ°μ νκ³ λλ©μΈμ κΈ°λ°ν Feature Engineeringμ ν΅ν΄ λͺ¨λΈμ μμΈ‘ μ νλλ₯Ό κ°μ νμ΅λλ€. κ·Έ κ²°κ³Ό, μμ μμ μν₯μ μ΅μννλ©΄μλ μ νν μμ λμ μμΈ‘ν μ μλ λͺ¨λΈμ κ°λ°νκ³ , μμΈ‘ μ νλ κ·Έλ¦¬κ³ μ΅μ’ 1μμ μ±κ³Όλ₯Ό κ±°λμμ΅λλ€.
- μ£Όμ : 건μ€κΈ°κ³μ μΌμ λ°μ΄ν°λ₯Ό νμ©νμ¬ μμ μ€λμ μ ννκ² μμΈ‘νλ AI λͺ¨λΈ κ°λ°
- λ°°κ²½: ν¨μ¨μ μΈ μμ κ΄λ¦¬λ κ±΄μ€ νμ₯μμ λΉμ© μ κ°κ³Ό μμ°μ± ν₯μμ νμμ μ λλ€. κ·Έλ¬λ μμ μμ μλ ¨λλ μ΄μ μ±ν₯μ μΌμ λ°μ΄ν°μ μν₯μ λ―Έμ³ λͺ¨λΈ μμΈ‘μ Noiseλ‘ μμ©ν μ μμ΅λλ€.
- λͺ©ν:
- μμ μμ κ°λ³μ μΈ μν₯λ ₯μ μ΅μννκ³ , λ€μν μΌμ λ°μ΄ν°λ₯Ό ν΅ν© λΆμνμ¬ μ νν μμ μ€λ μμΈ‘ λͺ¨λΈμ ꡬμΆ
- μ΄λ₯Ό ν΅ν΄ Fleet Management μ루μ κ³Ό κ°μ νμ₯ μλν μμ€ν μ μ μ© κ°λ₯
- λ¬Έμ μ€λͺ
:
- μμΈ‘λ μμ μ€λμ΄ μ€μ μ€λλ³΄λ€ ν¬κ² μμΈ‘λ κ²½μ°, μ΄ν μ₯λΉ λ°°μΉμ μμ κ³νμ λ¬Έμ κ° λ°μ
- μ€μ λ‘ νμν μ₯λΉλ³΄λ€ λ λ§μ μ₯λΉκ° λ°°μΉλμ΄ λΉν¨μ¨μ μ΄μ©κ³Ό μμ λλΉλ₯Ό μ΄λ
- ν΄κ²° λ°©ν₯:
- μμΈ‘ λͺ¨λΈμ΄ κ³Όλ μμΈ‘(Overprediction) λ¬Έμ λ₯Ό μ΅μννλλ‘ μμ€ ν¨μλ₯Ό μ€κ³νκ³ , λͺ¨λΈμ νκ° μ§νμ λ°μ
- λ¬Έμ μ€λͺ
:
- λμΌν μΌμ λ°μ΄ν°μλ λΆκ΅¬νκ³ , μμ μμ μ΄μ μ±ν₯μ λ°λΌ λ€λ₯Έ νλ ν¨ν΄μ΄ λνλ Noiseλ‘ μμ©
- μμ μμ μλ ¨λ μ°¨μ΄λ λͺ¨λΈμ΄ ν¨ν΄μ μΌλ°ννλ λ° μ΄λ €μμ μ€
- ν΄κ²° λ°©ν₯:
- Window Transform κΈ°λ²μ μ¬μ©ν΄ μμ μμ μν₯μ μ΅μννκ³ , κ³ μ λ κΈΈμ΄μ μκ³μ΄ λ°μ΄ν°λ₯Ό μμ±νμ¬ λͺ¨λΈμ νμ΅ μμ μ±μ λμ
- λΉμλ³ν λ¬Έμ : μ 곡λ λ°μ΄ν°λ λΉμλ³νλ μΌμ λ°μ΄ν°λ‘, μ₯λΉ μ νμ΄λ μΌμμ μν μ΄ λͺ νν μ 곡λμ§ μμμ΅λλ€.
- κ°μ μ€μ : λ°μ΄ν°λ₯Ό λΆμνκΈ° μν΄ λΉμλ³ν λ°μ΄ν°μ μ λ°μ μΈ νΉμ±μΌλ‘ λ¨Όμ κ΅΄μ°©κΈ° λ°μ΄ν°λ‘ κ°μ€μ μ€μ νμμΌλ©°, μΌλ°μ μΈ κ΅΄μ°©κΈ°μ μΌμ ꡬμ±μ λ°λΌ λ€μκ³Ό κ°μ κ°μ€μ μΈμ μ΅λλ€:
- Sensor A: Boom
- Sensor B: Body
- Sensor C: Bucket
- Sensor D: Arm
- κ²μ¦ κ³Όμ : PCA λΆμκ³Ό μκ°νλ₯Ό ν΅ν΄ κ° μΌμμ λ°μ΄ν° νΉμ±κ³Ό κ²½ν₯μ±μ λΆμνμ΅λλ€.
- κ²°κ³Ό: Sensor Aμ Cλ μ€λ μμΈ‘μ μ€μν μν μ νλ©°, Boomκ³Ό Bucketμ μμ§μκ³Ό κ΄λ ¨μ±μ΄ λμμ΅λλ€.
- Sensor Bμ Dλ Bodyμ Armμ μμ§μμ λ°μνλ©°, λ°λ κ²½ν₯μ±μ λ³΄μ¬ μ΄κΈ° κ°μ μ΄ μ ν¨ν¨μ νμΈνμ΅λλ€.
- λ¬Έμ 1: 짧μ Time Stamp κΈΈμ΄
- μκ³μ΄ λͺ¨λΈμ κΈ΄ μνμ€μμ ν¨ν΄μ νμ΅νλλ‘ μ€κ³λμμ§λ§, μ΄ λ°μ΄ν°λ 짧μ μνμ€λ‘ μΈν΄ 볡μ‘ν μ’ μμ±μ νμ΅νκΈ° μ΄λ €μ
- λ¬Έμ 2: μμ μμ μ λ³λμ±
- λ°μ΄ν° μνμ μμ μμ μ΄ μΌμ νμ§ μμ, μκ°μ 컨ν μ€νΈκ° μμ€λμ΄ λͺ¨λΈ μ±λ₯μ΄ μ νλ κ°λ₯μ±
- λ¬Έμ 3: λΆμ‘±ν νλ ¨ λ°μ΄ν°μ
- μ νλ μμ νμ΅ λ°μ΄ν°λ‘ μΈν΄, λͺ¨λΈμ΄ μΌλ°ννκΈ° μ΄λ €μ΄ μν© λ°μ
- μκ³μ΄ λ°μ΄ν° λ³ν:
- Transpose μ μ©: μκ³μ΄ νμμ λ°μ΄ν°λ₯Ό transposeνμ¬, μκ°μ μ λ³΄κ° κ°λ³ μΈλ±μ€μ νΌμ²λ‘ ν¬ν¨λλλ‘ λ³ννμ΅λλ€.
- ν¨κ³Ό: μκ° μμμ μμ‘΄νμ§ μκ³ , λͺ¨λ μκ° μ 보λ₯Ό κ°λ³ νΌμ²λ‘ λ€λ£¨μ΄, μκ³μ΄ λͺ¨λΈ λμ μΌλ°μ μΈ λ¨Έμ λ¬λ λͺ¨λΈμμ νμ΅ν μ μλλ‘ ν¨
- λͺ¨λΈ μ ν: Random Forest, LightGBM, CatBoost λ± λ€μν λͺ¨λΈμ μ¬μ©ν΄ μμλΈ
- Ensembling & Stacking: λ€μν λͺ¨λΈμ κ²°ν©νκ³ , Stacking κΈ°λ²μ ν΅ν΄ μ±λ₯ κ·Ήλν
- κ°μλ κ³μ°: μΌμ κ°μ λ³νμ¨μ λΆμν΄, λμ λΆνμ λ³νλ₯Ό λ°μ
- νμ ν ν¬: Boomκ³Ό Armμ κ°λ λ³νμ¨μ κ³μ°νμ¬, μ€λ μμΈ‘μ μ€μν νμ μ νμ ν¨κ³Ό λ°μ
- Window Transform: 5μ΄ λ¨μμ κ³ μ λ μλμ°λ‘ λ³ννμ¬, μμ μμ μ΄μ μ±ν₯μ λ 립μ μΈ λ°μ΄ν°λ₯Ό μμ±
- Seasonality Features: μκ°μ ν¨ν΄μ λ°μνκΈ° μν΄,
sin
λ°cos
λ³νμ μ¬μ©ν΄ μ£ΌκΈ°μ±μ ν¬μ°©
- μΌμ ν΄μ:
- Sensor A, C: μ€λμ΄ λμμ§μλ‘ κ°μ΄ λκ² λνλλ©°, Boomκ³Ό Bucketμ μμ§μκ³Ό μ°κ΄
- Sensor B, D: λ°λμ κ²½ν₯μ 보μ΄λ©°, μ£Όλ‘ Armκ³Ό Bodyμ μμ§μμ λ°μ
- λͺ¨λΈ νκ°: Overpred λ¬Έμ λ₯Ό μ΅μννκ³ , μ€μ μμ μ€λκ³Ό λμ μκ΄κ΄κ³λ₯Ό 보μ΄λ μμΈ‘ κ²°κ³Ό λμΆ
- μμΈ‘ λͺ¨λΈμ ν΅ν΄ μ₯λΉ μ΄μ©μ ν¨μ¨μ±μ κ·Ήλννκ³ , μμ κ³ν μ립μ κΈ°μ¬
- μ΄μ νμ§ κΈ°λ₯: μΌμ λ°μ΄ν°λ₯Ό ν΅ν΄ κΈ°κ³μ μ΄μ μ¬λΆλ₯Ό μ¬μ μ κ°μ§νμ¬, μ μ§λ³΄μ λΉμ© μ κ°
- μ νν μ€λ μμΈ‘μ ν΅ν΄, AI κΈ°λ° μλν κ΅΄μ°©κΈ° κ°λ° κ°λ₯μ± μ μ
- μμ μ± ν₯μ: μ€λ μμΈ‘μ ν΅ν μμ μ μμ μ±μ κ°ννκ³ , μ¬κ³ μνμ μ€μ
===========================================================================
-
train.csv κ° μ΄μ μμ μμ μ€λ μ λ³΄κ° μ΄λ¦μΌλ‘ μ£Όμ΄μ§ csv 16κ°(0, 100, 200, 300... 902 kg)
-> λΉμλ³νλ μΌμ λ° μκ·Έλ λ°μ΄ν° -
test.csv
μ½ 4000μ¬ μ΄μ μμ μΌμ λ° μκ·Έλ λ°μ΄ν° -
sample_submission.csv
κ° μ΄μ μμ λν μμ μ€λ μμΈ‘