1. 전문가팀 소개
기계음 이상탐지1 과정에서 '온도'와 '소음'이 기계 이상탐지의 결정적인 지표임을 확인할 수 있었다. 이제 정제된 데이터(cleaned_data.csv)를 기반으로 실제 현장에서 작동할 수 있는 머신러닝 모델을 구축해 볼 차례다.
이번에는 또 다른 에이전트 @model-master에게 통해 최적의 모델링을 수행하게 했고, @validator-bot에게는 모델의 강건성을 검증하게 시켰고, @report-wizard에게는 분석 리포트를 생성하고 문서화하게 했다.
에이전트들이 각자의 전문 영역에서 도구(Skill)를 사용하여 문제를 해결해 나가는 모습을 바라보면서, 난 탄성 밖에 지를 수 없었다. 와 ~ 뭐 이런게 ...
2. 모델 학습
지도학습의 대표적 알고리즘인 Random Forest와 XGBoost를 선정하여 학습을 진행했다. (GPU가 없어서 아쉽게도 DL은 해 볼 수 없었다) 이 과정도 @model-master 에이전트가 주도적인 역할을 수행했다.
2.1. 문제해결
처음에 로컬에 xgboost 라이브러리가 설치되어 있지 않다고 해서 내가 설치해줬다 ( 이런 건 내가 얼마든지 해줄께!) ) ModuleNotFoundError가 발생하며 프로세스가 중단되는 상황이었는데, 에이전트는 단순히 오류를 보고하는 데 그치지 않고, 환경을 분석하여 필요한 패키지 설치 명령어를 안내하고 스스로 환경을 재설정하여 학습을 완수했다. 에이전트는 사용자 개입 없이도 지능적으로 개발 환경의 문제를 해결할 능력을 갖추고 있었다.
2.2. 학습 체계 구축 및 결과
불균형 데이터 해소: 5%에 불과한 고장데이터를 스스로 증식하는 것도 놀라웠다. SMOTE를 적용하여 클래스 비율을 조정한 것이다.
성능 평가: 두 모델 모두 **F1-Score 1.0(100점)**이라는 극도의 정밀도가 나왔다. 이건 내가 데이터를 인위적으로 만들었기 때문이다 (내가 그런 걸 알고 있었을 텐데, 한마디도 불평하지는 않았다)
기여도 분석: XGBoost 모델 분석 결과, 전체 판단 기여도의 약 70%가 온도 신호에, 약 30%가 소음 신호에 집중되어 있음을 확인시켜 줬다.
예측모델까지 어려움 없이 만들어지니까 호기심이 발동했다. '