원하는 형식) 감정-스케치 데이터 셋 구축 및 PEFT를 통한 모델 성능 향상 연구: (최종적인 목표) 미술 치료 도구로써 활용하기.
스케치 데이터셋에 감정이 라벨링된 데이터를 통해 AI 모델은 다양한 감정 표현을 학습할 수 있으며, 이를 통해 미술치료 세션에서 내담자의 스케치를 분석하고 감정을 보다 정확하게 파악할 수 있습니다. 예를 들어, 내담자가 그린 그림에서 특정 감정이 어떻게 표현되었는지를 AI가 분석하면, 치료사는 해당 감정에 대한 보다 깊은 이해를 바탕으로 내담자와의 소통을 원활하게 할 수 있습니다.
또한, 이러한 데이터셋은 치료사에게 실질적인 참고 자료를 제공하여, 다양한 감정에 따른 적절한 접근 방식을 제시하는 데 도움을 줄 수 있습니다. 스케치를 통한 감정 표현은 말로 표현하기 어려운 감정을 시각적으로 전달할 수 있는 효과적인 방법이므로, AI와 미술치료의 결합은 치료의 효과를 높이고, 감정 인식을 강화하는 데 중요한 역할을 할 것입니다.
→ 연구 동기 및 목표 모두 최종목표 Fix 시 수정할 예정 3) 연구 내용 1.설문 조사 양식 및 목적 및 내용 2.설문 조사 결과 정리한 표 (각 감정마다 몇개인지 + 예시 및 의도 + 얼마나 드러나는가) 3.JSON 으로 DATA set만든 과정 및 결과 4. 스케치 데이터 기반 감정 분류 모델 구현 과정 및 결과 분할 정복중인 내용 정리{ 초기시도- Emoset 모델을 전체적으로 학습시키려 했으나, 12시간 정도의 학습 후 시스템 오류로 인해 중단! →LoRA(Lo-Rank Adaptation) 및 FL(Few-Shot Learning) 방식을 적용해보기로 결정 모델 배포 방법으로 Hugging Face를 사용하는 방법 - 필요한 토큰 생성, 라이브러리 설치, 클론 및 파일 생성 방법, PTH 파일과 모델 구조 저장의 필요성
데이터셋 관리 - JSON 파일을 활용하여 train/test/validation 데이터셋을 감정별로 분류, push to hub function을 통해 Hugging face에 데이터를 업로드 할때 대용량 파일 업로드 시 네트워크 에러 문제를 해결 가능!
데이터 전처리-데이터 전처리 과정에서 첫 번째 코드에서 Json file에서 감정 라벨 빼고 제거(데이터 전처리), 두 번째 코드가 감정마다 이미지 분류를, 세 번째 코드에서 parquet형식으로 higging face에 업로드 하는 작업을 수행했다.
모델 성능 테스트: Hugging Face에 업로드한 데이터셋을 바탕으로 3개의 테스트를 진행했다. 테스트 결과로 test1에서 70% 이상, test2에서 100%, test3에서 60%의 정확도를 기록하였다.
크롤링- 총 844개의 이미지를 모은 후, 이를 JSON 파일 형식으로 변환하여 Hugging Face에 등록함. Cycle GAN- 이미지 변환을 위해 Cycle GAN을 사용, 이를 통해 스케치 데이터의 감정 표현을 강화하고, 이미지 세분화 작업을 시도. but 메모리 사용량이 커서 적절한 데이터 크기로 조정하는 작업이 필요했음. → GAN 변환 결과를 JSON 파일 형식으로 구성하여 감정 레이블을 매핑하였습니다.
크롤링, Cycle GAN, parameter fix, finetuning methods로 모델 최적화 시키기 →파인튜닝 메소드, 파라미터 고정 후 데이터셋 테스트,,다양한 데이터셋 조합에서 테스트 →데이터셋과 파라미터 고정 후 파인튜닝 메소드 테스트,, 각 메소드를 테스트
→파인튜닝 메소드, 데이터셋 고정 후 파라미터 테스트,, 특정 데이터셋, 메소드 고정후, 파라미터 조정
GPT tuning-GPT 모델을 통한 파인튜닝
} 5. 정확도 분석 - 저번에 찾은 메트릭 중 2개정도 선정하여 평가 6. GPT API를 적용시킨 모델 개발(가능?)
발전 방향
→ 목적이 있어야 하기에 초반의 목표로 설정하였던 미술치료의 도구로써 사용될 수 있도록 제안하는 것을 최종 목적지로 밀고나가는게 어떠한가?