resource detail

고차원 유전체 데이터에 적용된 심층 잔여 신경망의 근접 정규화

2026-05-26 07:00
고차원 유전체 데이터 세트는 복잡한 생물학적 잡음으로 구성된 복잡한 패턴을 포함하고 있어 유전학과 육종의 예측 모델링에 주요한 도전 과제를 제시합니다. 잔차 신경망(ResNets)은 비선형 유전체 효과를 포착하는 강력한 프레임워크를 제공하지만 마커 수가 샘플 수를 크게 초과하는 조건에서는 과적합이 자주 발생합니다. 이를 해결하기 위해 다양한 정규화 방법이 제안되었습니다. 유망한 접근법 중 하나는 근접 매핑 기법에 의존하는데, 이는 최적화 알고리즘에 직접 통합될 수 있어 계산 효율적입니다. 그러나 다양한 볼록 또는 비볼록 근접 정규화를 사용한 ResNets의 성능은 고차원 데이터에서 아직 충분히 탐구되지 않았습니다. 본 연구에서는 볼록 및 비볼록 정규화 기법을 모두 처리할 수 있는 확장된 확률 적응 근접 경사 ResNet 방법을 제안하고, 볼록 및 비볼록 정규화 기법에 대한 수렴 보증 분석을 제시합니다. 또한, 실제 고차원 유전체 데이터 세트인 마우스, 돼지, 밀, 롭로리 소나무에 대한 감독 회귀 설정으로 예측 성능을 평가합니다. 비교를 위해 같은 정규화를 사용한 전통적인 희소 선형 근접 방법 및 LightGBM도 구현하고 평가합니다. 실험 결과, 18-레이어 ResNet이 $L_{ rac{1}{2}}$ 정규화를 통하여 마우스와 돼지 데이터 세트에서 다른 설정들보다 뛰어난 성능을 보여줍니다. 밀과 롭로리 소나무 데이터에서는 15-레이어 ResNet $L_{ rac{1}{2}}$ 설정이 가장 낮은 테스트 평균 제곱 오차와 가장 높은 거리 상관(dCor)을 달성합니다. 이러한 발견은 정규화된 적응적 근접 경사 ResNet 방법의 효과와 고차원 유전체 데이터의 예측 작업에 대한 잠재력을 강조합니다.