자연 언어 처리에서 Google BERT를 비롯한 기반 모델이 빠르게 발전하고 있습니다. 기반 모델(Foundation Model, FM)은 대규모 데이터로 학습하며 다양한 작업에 이용할 수 있는 모델을 말합니다. 이런 모델은 쉽게 다룰 수 없고, 여러 부서에서 각자 개발하면 낭비가 발생하기도 합니다.
이에 기반 모델의 학습 및 추론을 자동화할 수 있는 플랫폼 'AutoFM'을 사내 AI 플랫폼에서 개발하고 있습니다. 구체적으로, 학습 데이터만 준비하면 코드를 작성하지 않고도 모델 학습 및 추론을 할 수 있도록 하고, 사내에 축적된 대규모 텍스트로 학습한 기반 모델 공유를 진행하고 있습니다.
Yahoo! JAPAN에서 AutoFM을 활용한 사례, 특히 검색 쿼리의 카테고리 분류에 대해 설명합니다.