머신러닝&딥러닝(41)
-
Understanding Diffusion Models : A Unified Perspective 리뷰
이 자료는 Google Research Team의 Calvin Luo가 2022년 Diffusion model의 전반적인 튜토리얼을 위해 작성한 자료이다. 원문도 꽤 이해하기 쉽진 않게 쓰여 있지만, 공부하는 차원에서 정리해 보았다. Introduction : Generative ModelsGenerative model이란 무엇인가? x의 distribution p(x)를 실제와 가깝게 근사하는 모델을 말한다. (distribution p를 얻으면, 생성은 해당 분포에서 샘플링하는 것으로 할 수 있다) GM은 세 개의 클래스가 있다. 첫째는 adversarial manner로 훈련되는 GAN 계열이다. 둘째는 likelihood-based manner 로 훈련되는 autoregressive model, ..
2025.04.14 -
cGAN (2014)의 간단한 오버뷰
cGAN (conditional generative adversarial nets)은 2014년에 나온 꽤 고전적인 생성모델 논문이다. NeurIPS에 출판된 GAN 논문과 달리, cGAN은 GAN에 conditioning을 추가한 정도의 architecture로 따로 출판된 적은 없으며 arxiv preprint로만 있다. https://arxiv.org/abs/1411.1784 물론 RoCGAN 등 cGAN의 후속 연구는 좋은 학술지나 컨퍼런스에 많이 실렸다. Conditional Generative Adversarial NetsGenerative Adversarial Nets [8] were recently introduced as a novel way to train generative model..
2025.01.22 -
rs-fMRI 분류를 위한 ST-GCN 모델
전통적인 GCN(https://cascade.tistory.com/134)은 시간적 요소가 포함되어 있지 않고, node와 edge 관계가 고정된 상태에서 사용한다. ST-GCN은 특정 시간에서의 graph 구조 (spatial graph)와 시간에 따라 변하는 graph 구조 (temporal graph)를 모두 모델에 반영할 수 있는 모델이다. 본 포스팅에서는 Stanford 컴퓨터공학과 및 의학과 공동연구로 S.Gadgil, Qingyu Zhao et al이 2021년 저술한 ST-GCN fMRI classification 논문인 "Spatio-Temporal Graph Convolution for Resting-State fMRI Analysis"을 리뷰할 것이다. 주요한 task : Age, ..
2025.01.16 -
GAT(Graph Attention Networks)를 통한 동적 그래프 모델링
전통적인 GCN(https://cascade.tistory.com/134) 은 고정된 adjacency matrix를 사용한다. 하지만 실제로는 그래프에서 노드 간의 관계는 가변적이다. (소셜 미디어를 예시로 들면, 새로 친구를 맺거나 친구를 끊는 이용자들이 있다). GCN에서 이러한 요소를 개선하려는 시도는 많이 있어왔는데, 대부분의 경우 계산량이 많은 행렬연산 (inversion 등)을 동반한다. ICLR 2018에 등장한 GAT (Graph Attention Networks)는 attention을 이용하여 이러한 가변적인 그래프 연결관계를 적절한 계산량으로 잘 모델링한다. GAT의 동작과 수식GAT는 가변적인 엣지를 attention vector를 통해 모델링한다. 한 번의 업데이트에는 아래 세 가..
2025.01.14 -
GCN의 개요와 수식 정리
GCN은 2016년 Kipf와 Welling의 " Semi-supervised classification with graph convolutional networks" (ICLR 2017)으로 처음 등장하였다. GCN은 일부 노드의 label과 각 노드의 연결관계가 주어진 상태에서 label이 주어지지 않은 노드를 예측하는 node classification을 목적으로 설계되었으나, 전체 그래프에 부여된 label을 예측하는 graph classification에도 사용될 수 있다. Graph classification에서는 일반적인 GCN에 pooling layer가 적용된 형태를 주로 이용한다. Node classification과 graph classification에서는 Cross Entropy..
2025.01.13 -
FixMatch의 트레이닝 디테일
FixMatch (Sohn et al, 2020)는 적은 수의 labeled data와 많은 수의 unlabeled data가 섞인 데이터셋에서 학습을 할 때 pseudo-labeling 기반으로 unlabeled data를 utilize하는 반지도학습(semi-supervised learning) 기법이다. Fixmatch는 Mixup이라는 다소 복잡(?)한 unlabeled data utilization 기법을 가진 MixMatch(2019)에 비해 단순하면서도 보편적인 아이디어를 제공하여 많은 반지도학습 상황에 응용되어 왔다. 아이디어를 간단하게 소개하면, labeled data는 일반적인 supervised learning처럼 이용하고, unlabeled data는 모델의 confidence가 특..
2024.08.20