[연구] LAMDA Lab(지도교수: 오하영), The 41st ACM/SIGAPP Symposium on Applied Computing (SAC 2026) Main CoMain Conference 5편 게재 승인
- 인공지능융합학과(일반대학원)
- 조회수1079
- 2025-11-26
LAMDA연구실(지도교수: 오하영)의 논문이 인공지능·정신건강 융합 분야의 국제 학술대회인 The 41st ACM/SIGAPP Symposium on Applied Computing (SAC 2026) Main Conference에 5편 게재 승인(Accept) 되었습니다.
1) Can LLM Agents Really Simulate Clients in Counseling?

왼쪽부터 LAMDA Lab 인공지능융합학과 유선희, 김동명, 노유진, 권경민 학생(지도교수 : 오하영)


최근 연구들은 상담 장면에서 내담자를 재현하기 위해 대규모 언어모델(LLM)을 활용하는 시도를 활발히 진행해왔다. 그러나 LLM이 과도하게 긍정적인 반응을 생성하는 경향이 지속적으로 보고되어 왔으며, 이는 시뮬레이션 상호작용의 현실성을 저하시킨다는 한계로 지적되고 있다. 본 연구는 이러한 긍정 편향이 실제로 다양한 폐쇄형·오픈소스 모델 전반에서 나타나는지를 정량적으로 검증하고, 이를 완화하기 위한 전략의 효과를 분석하는 것을 목표로 한다. 이를 위해 임상 전문가 기준에 기반해 내담자 발화를 정서(sentiment)와 태도(stance) 두 차원에서 평가하는 데이터셋과 평가 모델을 구축하였다. 이후 다중 LLM 모델과 편향 완화 전략을 적용하여 인공 상담 대화를 생성하고, 실제 상담 데이터를 기준으로 편향의 존재 여부와 완화 효과를 비교 분석하였다. 실험 결과, 대부분의 LLM 내담자 모델은 실제 환자 대화와 통계적으로 유의한 차이를 보이며 긍정 편향을 나타냈다. 제안된 편향 완화 전략은 이러한 편향을 어느 정도 감소시키기는 했지만, 실제 환자 발화 수준과 완전히 정렬되는 데에는 아직 미치지 못했다. 본 연구 결과는 LLM 기반 상담 시뮬레이션과 실제 환자 반응 간의 정량화 가능한 격차가 존재함을 보여주며, 이를 해소하기 위해 표준화된 평가 프레임워크, 상담 맥락에 적응하는 편향 완화 기법, 그리고 페르소나 설계 전략의 발전이 필요함을 시사한다.
2) EEG-Informed Neuroadaptive Language Model for CBT

왼쪽부터 LAMDA Lab 인공지능융합학과 김효빈 졸업생, 이진권 학생(지도교수 : 오하영)
본 연구는 텍스트만 보는 기존 CBT 챗봇이 사용자의 비언어적 상태를 반영하지 못하는 한계를 극복하기 위해, 소비자용 EEG와 멀티에이전트 LLM을 결합한 NeuroCBT 프레임워크를 제안합니다.

시스템은 CBT의 인지 삼각형에 맞춰 생각(Thought)·감정(Feeling)·행동(Behavior) 에이전트를 구성하고, 머리띠형 EEG(예: Muse-S)에서 추출한 인지 부하·각성도·전전두 비대칭(FAA) 지표를 해석하는 EEG 분석 에이전트가 이들을 조정·게이팅하도록 설계되었습니다. 모든 EEG 전처리(대역통과 필터, 노치, ASR, 재참조, 윈도우/홉 크기 등)와 지표 산출식(θ/α/β 파워 비율, 회피 지수 등)을 논문에서 투명하게 공개해, 뉴로어댑티브 대화 시스템의 재현성을 확보했습니다.
아울러 약 6,000개의 EEG–텍스트 삼중항으로 학습한 단일 모델 변형인 NeuroCBT-LLM을 제시해, EEG를 토큰화된 컨텍스트로 직접 주입하는 경량 배포 옵션도 함께 제공합니다. 무작위 EEG를 섞은 대조 실험과 창(window)·채널 수·인코더 구조에 대한 소거 실험에서, 생리 신호를 정교하게 반영할수록 공감성, 안내 품질, 상호작용성이 유의미하게 향상되는 것이 확인되었습니다. 32명을 대상으로 한 사용자 연구에서는 텍스트 기반 CBT 챗봇 대비 공감도와 정서적 일치감 평가가 유의하게 상승해, NeuroCBT가 실시간·폐루프형 정신건강 개입의 실용적인 아키텍처임을 보여줍니다.
3) GoTCHA: Hierarchical Graph-of-Thoughts for Explainable Cognitive Distortion Classification

왼쪽부터 LAMDA Lab 인공지능융합학과 양하연, 홍지흔, 박진경, 권경민 학생(지도교수 : 오하영)

본 연구는 CBT 상담 대화 속에서 겹쳐 나타나는 인지 왜곡과 그 배경에 있는 신념 구조를 정밀하게 분석하기 위해, 계층적 Graph-of-Thoughts 프레임워크인 GoTCHA를 제안합니다. 시스템은 내담자의 발화를 ‘Objective Fact’’과 ‘Subjective Thoughts’으로 분리하는 갭 분석을 수행한 뒤, core belief – fine-grained belief – cognitive distortion의 3단계 위계 구조로 추론합니다. 각 단계에서 여러 후보 생각을 생성하고, 심리학적 타당성·구조적 일관성·입력 관련성 점수로 평가하여 최적의 생각만을 선택하는 것이 특징입니다. 점수가 일정 기준보다 낮을 경우 상위 단계로 거슬러 올라가 다시 추론하는 조건부 역추론·자동 정제 메커니즘을 도입해, 한 번의 오판이 아래 단계로 연쇄 전파되는 문제를 크게 줄였습니다. CBT-BENCH 데이터셋에서 GoTCHA는 인지 왜곡 F1 0.695, 핵심 신념 0.850, 세부 신념 0.803을 기록하며, 특히 세부 신념 과제에서 기존 최고 기법 대비 38% 상대 향상(0.582→0.803)을 달성했습니다. 정제 모듈을 제거하면 F1이 0.695에서 0.439까지 급락해, 제안한 오류 수정 메커니즘의 중요성도 입증했습니다. GoTCHA는 임상 현장에서 “이 사람이 어떤 왜곡된 생각을, 어떤 핵심 신념에서 비롯해 하고 있는지”를 구조적으로 보여주는 도구로, 설명 가능한 인지 왜곡 분석과 자동화된 CBT 지원의 기반을 제시합니다.
4) HERA: Hybrid Emotion Recognition Model for Alexithymia Assessment Using AI and Multimodal Data

왼쪽부터 LAMDA Lab 인공지능융합학과 성연준, 유상현, 김서영, 손동영 학생(지도교수 : 오하영)

본 연구는 자신의 감정을 인식·언어화하기 어려운 특성인 알렉시시미아(alexithymia)를, 설문지에만 의존하지 않고 행동·표정·시선·언어 데이터를 통합한 하이브리드 모델 HERA로 평가하는 프레임워크를 제안합니다. 80명의 참가자가 긍정·부정 감정을 유발하는 영상 클립을 시청하며 감정을 느낄 때 버튼을 누르고, 이후 자유 서술형으로 느낀 점을 작성하도록 설계했습니다. 시스템은 얼굴 표정 분석, 시선 추적, 버튼 반응 패턴, GPT-4 기반 텍스트 분석을 통해 감정 어휘 사용, 정서 극성, 맥락의 구체성 등을 추출합니다. 이렇게 얻은 멀티모달 지표를 Perth Alexithymia Questionnaire(PAQ)의 세 하위 척도(DIF, DDF, EOT)에 매핑하고, 우울 수준(PHQ-9)을 가중치로 활용해 예측 정확도를 높였습니다. 회귀 분석 결과, 통합 멀티모달 모델의 설명력은 R² = 0.30으로, 특히 얼굴 표정과 언어 지표가 성능 향상에 크게 기여했습니다.
HERA는 ‘자기 보고’에 취약할 수밖에 없는 알렉시시미아를 행동 기반으로 정량화함으로써, 기존 설문을 보완·부분 대체할 수 있는 새로운 평가 경로를 제시합니다. 이는 감정 인식이 어려운 집단(청소년, 의료인 등)에 대한 조기 선별, 디지털 치료제·감정 인식 인터페이스 설계에 중요한 기초를 제공합니다.
5) Multi-Agent LLM Framework for PRECEDE–PROCEED Aligned Behavior Change Intervention Design

LAMDA Lab 인공지능융합학과 이진권 학생(지도교수 : 오하영)
본 연구는 실제 보건 프로그램 기획에서 PRECEDE–PROCEED 모형을 제대로 쓰기 어려운 이유(시간 압박, 전문가 불균형, 근거 검색 난이도)를 해결하기 위해, 이 모형에 정렬된 멀티에이전트 LLM 설계 프레임워크를 제안합니다. 제안 시스템은 대상 집단 대표, 임상의/교육자, 지역사회 파트너, 행정 담당자 등 다양한 이해관계자를 역할 특화 에이전트로 모델링하고, 각 에이전트가 자신의 관점에 맞는 문헌·가이드라인을 검색하는 역할 정렬 RAG(Role-aligned Retrieval-Augmented Generation) 구조를 채택합니다.

에이전트들은 제안–비판–수정(propose–critique–revise) 루프를 여러 라운드 수행하며, 중재 내용의 충돌을 해소하고 합의안을 만들어 냅니다. 이 과정에서 모더레이터 에이전트가 TIDieR(12항목)와 BCTTv1(93개 행동변화 기법 분류) 체크리스트를 내장된 제약으로 활용해, 생성된 중재 매뉴얼의 누락·모순을 자동 검증합니다. 연구는 대학생·청년층을 대상으로 한 수면 위생, 신체활동(주 150분), 디지털 과다사용 관리(스크린타임/알림 조절) 세 시나리오를 중심으로, 단일 LLM·셀프컨시스턴시·일반 토론형 멀티에이전트와 비교 평가를 수행했습니다. 그 결과 제안 프레임워크는 보고서의 체크리스트 완전성, 이해관계자 정렬도, 모순 감소, 전문가 선호도에서 모두 우수한 성과를 보여, 이론에 정렬된 ‘체크리스트 완비형’ 중재 설계 자동화의 가능성을 입증했습니다.
발전기금


