논문 리뷰 | Pix2Pix: Image-to-Image Translation with Conditional Adversarial Networks (CVPR 2017)
·
AI · 컴퓨터 이론/Computer Vision
[논문]Isola, P., Zhu, J.-Y., Zhou, T., & Efros, A. A. (2018). Image-to-image translation with conditional adversarial networks. arXiv. https://arxiv.org/abs/1611.07004v3 0. TL;DR논문의 Key Points로, 이에 유념하며 읽는 것을 추천한다.저자의 의도Vision domain의 다양한 image-to-image translation task를 수행할 수 있는 범용적 프레임워크 연구핵심 요소- cGAN 적용을 통해 input img $x$와의 일관성 유지- U-Net-based generator로 디테일 유지- Markovian discriminator로 local de..
논문 리뷰 | Multi-Task Self-Supervised Visual Learning (ICCV 2017)
·
AI · 컴퓨터 이론/Computer Vision
[논문]Doersch, C., & Zisserman, A. (2017). Multi-task self-supervised visual learning. Proceedings of the IEEE International Conference on Computer Vision (ICCV), 2051–2060. https://doi.org/10.1109/ICCV.2017.224 0. TL;DR논문의 Key Points로, 이에 유념하며 읽는 것을 추천한다.저자의 의도Vision 도메인에서 labeled dataset은 너무 비싸기 때문에 SSL로 돌파구를 구상 및 가능성 검증핵심 요소- Common trunk를 통해 multi-task에 대해 범용적인 visual representation을 학습하도록 함- ..
논문 리뷰 | AlexNet: ImageNet Classification with Deep Convolutional Neural Networks (NIPS 2012)
·
AI · 컴퓨터 이론/Computer Vision
[논문]Krizhevsky, A., Sutskever, I., & Hinton, G. E. (2012). ImageNet classification with deep convolutional neural networks. Advances in Neural Information Processing Systems, 25, 1097–1105. 0. TL;DR논문의 Key Points로, 이에 유념하며 읽는 것을 추천한다.+) 꽤 오래된 논문이기 때문에 지금은 사용하지 않는 기법이나 와닿지 않는 표현(특히 스케일 측면에서)이 있을 수 있다. 시대적 배경을 잘 감안하며 읽기 바란다.저자의 의도당시(2012년) 기준으로 대규모 이미지 데이터셋을 분류 가능한 대형 모델을 구축하여 CV 도메인의 한계 돌파핵심 요소- ..