[연구] LAMDA연구실(지도교수: 오하영) PAKDD 2026(3편), WWW 2026(1편), WOWMOM 2026(1편), ICASSP 2026(1편) 총 논문 6편 채택
- 인공지능융합학과(일반대학원)
- 조회수871
- 2026-03-11

LAMDA Lab(오하영 교수)에서 탑티어 학회 4곳에서 총 논문 6편이 채택되었습니다.
PAKDD 2026(3편), WWW 2026(1편), WOWMOM 2026(1편), ICASSP 2026(1편)
- - PAKDD(Pacific-Asia Conference on Knowledge Discovery and Data Mining)
- - WWW(The Web Conference)
- - WOWMOM(IEEE International Symposium on a World of Wireless, Mobile and Multimedia Networks)
- - ICASSP(IEEE International Conference on Acoustics, Speech and Signal Processing)
1) Explainable Cognitive Task Classification in Pediatric EEG Using CPCC-Based Functional Connectivity Images /
PAKDD(Full paper)

왼쪽부터 LAMDA Lab 인공지능융합학과 이진권, 홍서현 학생(지도교수 : 오하영)

본 연구는 소아 및 청소년의 뇌파(EEG) 데이터를 활용하여 다양한 인지 과제를 자동으로 분류하고 그 근거를 해석할 수 있는 설명 가능한 딥러닝 기반 분석 프레임워크를 제안한다. 기존 EEG 기반 인지 상태 분류 연구는 개별 채널의 시계열 특징이나 블랙박스 형태의 딥러닝 모델에 의존하는 경우가 많아 뇌 영역 간 상호작용을 충분히 반영하지 못하고 결과 해석이 어렵다는 한계가 있었다. 이를 해결하기 위해 본 연구에서는 채널 간 기능적 연결성을 정량화하는 Complex Pearson Correlation Coefficient(CPCC)를 이용해 EEG 신호로부터 연결성 행렬을 계산하고 이를 이미지 형태로 변환하여 CNN 모델에 입력하는 방식을 제안하였다. 또한 absCPCC와 imCPCC 두 가지 연결성 지표를 결합하여 뇌 영역 간 동기화 패턴을 보다 효과적으로 반영하도록 설계하고, ImageNet 사전학습 ResNet-18 모델을 활용해 인지 과제를 분류하였다. Healthy Brain Network(HBN) 데이터셋의 598명 참가자와 3,200개의 EEG 세션을 이용한 실험 결과, 제안된 방법은 기존 raw EEG 기반 모델 대비 크게 향상된 67.8%의 정확도와 59.5%의 macro F1 성능을 달성하였다. 또한 Grad-CAM 기반 설명 기법을 통해 후두-두정 알파 네트워크, 전두-측두 세타 연결성, 전두-두정 베타 연결성 등 과제별로 중요한 뇌 연결 패턴을 시각적으로 해석할 수 있음을 확인하였다. 이러한 결과는 기능적 연결성 기반 EEG 표현과 설명 가능한 딥러닝을 결합한 접근이 소아 인지 상태 분석과 디지털 치료제 및 뇌-컴퓨터 인터페이스 분야에서 유용하게 활용될 수 있음을 보여준다.
2) Table-Aware Group Relative Policy Optimization: Reward Design for Large Vision–Language / PAKDD(Full paper)

왼쪽부터 LAMDA Lab 인공지능융합학과 이지윤, 실감미디어공학과 박황선 학생(지도교수 : 오하영)

본 연구는 표 기반 시각 질의응답(Table VQA) 문제에서 대형 비전-언어 모델(LVLM)의 구조적 추론 능력을 향상시키기 위한 강화학습 프레임워크인 Table-Aware Group Relative Policy Optimization(TAG)을 제안한다. 기존 방법들은 최종 정답 정확도 중심의 보상이나 Chain-of-Thought(CoT) 지도에 의존하여 표의 행, 열 구조와 셀 간 관계를 충분히 반영하지 못하는 한계가 있었다. 이를 해결하기 위해 본 연구에서는 기존 GRPO 강화학습 방식에 Table Recognition Reward를 추가하여 모델이 행 헤더, 열 헤더, 셀 값 등 표 구조 정보를 명시적으로 활용하도록 유도하였다. 보상 함수는 정답 정확도(Accuracy), 출력 형식(Format), 표 구조 인식(Table Recognition)의 세 가지 요소로 구성되며, 이를 통해 모델의 중간 추론 과정에서 구조적 정보를 활용하도록 설계하였다.
실험은 TableVQA, TableBench, MMSci, TABMWP, ComTQA, Wild-Table, ChartQA Pro 등 7개의 벤치마크 데이터셋에서 수행되었으며, Qwen3-VL-4B 기반 모델에 TAG를 적용한 결과 기존 GRPO 및 여러 공개 모델 대비 성능 향상을 보였다. 특히 4B 규모 모델임에도 일부 32B 모델 및 GPT-4.1과 유사하거나 더 높은 성능을 달성하여 구조 인식 기반 보상 설계의 효과를 입증하였다.
또한 Table Recognition Reward를 제거한 경우 성능이 감소하는 것으로 나타나, 표 구조 키워드를 활용한 보상이 모델의 구조적 추론 능력을 향상시키는 핵심 요소임을 확인하였다. 이러한 결과는 표 및 차트 기반 멀티모달 추론에서 구조 인식 보상 설계가 모델 성능을 크게 개선할 수 있음을 보여준다.
3) BatterySurAD : A Dataset for Anomaly Detection on Cylindrical Battery Surfaces with Spatial Zone Annotations /
PAKDD(Full paper)

LAMDA Lab 인공지능융합학과 박지원 학생 (지도교수 : 오하영)
본 연구는 리튬 이온 배터리 제조 공정에서 발생하는 미세 결함을 정밀하게 탐지하기 위해, 반사 특성을 가진 파우치형 배터리 표면에 특화된 대규모 데이터셋인 BatterySurAD를 제안한다.

[Fig. Dataset 구축 과정]

[Fig. 결함 및 뷰별, 모델별 통계 분석 결과]
이 시스템은 배터리 표면을 15개의 공간 구역(3×5 그리드)으로 세분화하여 위치별 결함 분포를 분석하며, 전문가의 검수를 거친 4가지 주요 결함(Folding, Scratching, Denting, Contamination)에 대한 이중 뷰(전면/후면) 데이터를 제공한다. 총 8,559장의 원본 이미지를 기반으로 회전, 밝기, 노이즈 등 실제 제조 현장의 물리적 환경을 반영한 10배 증강(Augmentation) 기법을 적용하여 총 129,405장의 고해상도 이미지를 구축하였으며 이는 차후 공개될 예정이다. 720회 이상의 독립적인 통계 테스트를 통해 분석한 결과, 기존 범용 데이터셋과는 58.1%의 유의미한 분포 차이를 보여 배터리 표면 탐지의 높은 난이도를 입증하였으며 특히 반사 표면에서 발생하는 재구성 실패(Reconstruction Failure)와 경계 구역에서의 검출 성능 저하(Peripheral Zone Collapse) 등 기존 AI 모델들의 체계적 결함을 규명하였으며, 이를 보완하기 위해 DINO 및 CLIP 기반의 경량화된 적응형 베이스라인을 함께 제시하였다.
이번 연구는 안전이 직결된 배터리 산업에서 위치 기반의 정밀한 이상 탐지를 가능하게 하는 핵심 자원을 제공하며, 향후 공간 인지형 AD(Anomaly Detection) 아키텍처와 반사 표면 강건성 연구의 새로운 이정표가 될 것으로 기대한다.
4) MACA: A Multi-Agent Cognitive Adaptation Framework for Human–Agent Collaborative Decision Making /
WWW(Short paper)

LAMDA Lab 인공지능융합학과 성연준 학생(지도교수 : 오하영)

이 연구는 사용자의 실시간 인지 상태에 적응하는 웹 기반 의사결정 지원 프레임워크(MACA)를 제안한다. 시스템은 웹캠을 통해 얼굴 표정 분석(ResEmoteNet)과 시선 안정성 추적(MediaPipe)을 수행하여 사용자의 감정 상태와 주의 집중 정도를 추정하고, 이를 결합하여 인지 부하(cognitive load) 지표를 계산한다. 이 지표는 Planner–Critic–Executor 구조의 멀티 에이전트와 계층적 Monte Carlo Tree Search(MCTS) 기반 추론 과정에 반영되어, 에이전트 간 협업 방식, 탐색 깊이, 그리고 사용자에게 제공되는 피드백의 강도와 속도를 동적으로 조절하는 데 사용된다. 시스템은 Sense–Plan–Critique–Execute 루프를 통해 사용자 상태를 지속적으로 반영하며 의사결정 과정을 지원한다. 연구에서는 복잡한 제약 조건 하에서 최적의 선택을 수행해야 하는 의사결정 과제 대상(task)을 사용하여 30명의 참가자가 참여한 2×2 within-subject 실험을 수행하였다. 실험 결과, 사용자 상태에 적응하는 Multi-Adaptive 조건이 다른 조건 대비 의사결정 품질을 약 10.7% 향상시키는 동시에 정신적 노력은 약 14.1% 감소시키는 것으로 나타났으며, 이는 멀티모달 사용자 상태 인식과 적응형 멀티에이전트 추론이 사용자 인지 부담을 증가시키지 않으면서 의사결정 효율을 향상시킬 수 있음을 보여준다.
5) Fine-Tuned LLMs for Flow-Based Intrusion Detection in Smart Agriculture via Semantic Augmentation /
WOWMOM(Full paper)

왼쪽부터 LAMDA Lab 인공지능융합학과 이진권, 성연준 학생(지도교수 : 오하영)

이 논문은 스마트 농업 IoT 네트워크에서 발생하는 침입을 탐지하기 위해 flow 기반 네트워크 데이터를 LLM으로 분석하는 intrusion detection 시스템을 제안한다. 기존 IDS는 심한 클래스 불균형과 중복된 트래픽 데이터 때문에 희귀 공격 탐지 성능이 낮다는 문제가 있는데, 이를 해결하기 위해 연구진은 네트워크 flow의 수치형 특징을 텍스트 프롬프트로 변환하여 LLM(Qwen2.5-1.5B)을 LoRA로 파인튜닝하고, 데이터 다양성을 높이기 위해 reasoning paraphrasing(설명 문장 다양화)과 feature transformation(수치 feature 변형)을 결합한 semantic augmentation 기법을 적용했다. 그 결과 기존 Random Forest 기반 IDS의 76.4% 정확도를 95.1%까지 향상시켰으며 특히 ARP spoofing 같은 희귀 공격 탐지 성능이 크게 개선되었고, 모델은 단순 분류뿐 아니라 탐지 이유를 자연어로 설명하는 explainable IDS를 제공한다.
6) EEG-to-Text as Restoration: A Discrete Diffusion Framework for Robust BCI / ICASSP(Full paper)

LAMDA Lab 김효빈 학생(지도교수 : 오하영)

본 연구는 뇌파(EEG) 신호의 불안정성과 기존 자기회귀(Autoregressive, AR) 모델의 오류 누적 문제를 해결하기 위해, 직접 번역에서 '복원(restoration)' 패러다임으로 전환한 새로운 EEG-to-Text 프레임워크인 DELTA를 제안한다. 기존 AR 모델은 노이즈가 심한 EEG 환경에서 초기 오류가 연쇄적으로 증폭되어 전체 출력 품질을 심각하게 저하시키는 치명적인 한계가 있었다. 이를 극복하기 위해 DELTA는 먼저 RVQ(Residual Vector Quantization) 기반 토크나이저를 활용해 연속적이고 불안정한 EEG 파형을 안정적인 이산형 표현(discrete representation)으로 변환하여 노이즈를 필터링한다. 이후 LLaDA 기반의 비자기회귀(non-autoregressive) 확산 모델(Diffusion Model)을 도입하여, 텍스트를 순차적으로 생성하는 대신 전체 문장 구조를 점진적으로 디노이징(denoising)함으로써 연쇄적인 오류 전파를 근본적으로 차단한다. ZuCo 데이터셋(1.0 및 2.0)을 활용한 실험 결과, 제안된 모델은 단어 수준 특징에서 기존 최고 성능 모델(SOTA)들을 5점 이상 크게 능가하며 BLEU-1 21.9, ROUGE-1 F1 17.2라는 압도적인 성능을 달성했다.
또한, 절제 연구(Ablation study)를 통해 RVQ 토크나이저의 필수적인 역할과 확산 단계(최적 T=30)가 디코딩 성능에 미치는 결정적 영향을 입증하였다. 이러한 결과는 뇌파를 이산화하고 확산 모델을 통해 텍스트를 병렬적으로 복원하는 접근법이 뇌 신호 해독에 있어 훨씬 더 강력하고 신뢰할 수 있음을 입증하며, 향후 전체 파라미터 미세조정 및 더 크고 다양한 데이터셋으로의 확장 연구 방향을 제시한다.
발전기금


