https://arxiv.org/abs/2011.13920
Unsupervised part representation by Flow Capsules (Sara Sabour, Andrea Tagliasacchi, Soroosh Yazdani, Geoffrey E. Hinton, David J. Fleet)
캡슐 네트워크를 사용해 이미지에서 이미지 주요 구성 요소들을 분해하도록 학습. 영상에서의 움직임을 이 self supervision의 주요한 단서로 활용. 인간은 고정된 영상을 보는 경우가 사실상 없기 때문에 영상을 활용하는 것이 좋은 방향이 될 수 있다고 생각.
#self_supervised_discovery