Study: Artificial Intelligence(AI)
[Perception] 포인트 클라우드(Point Cloud): PCL PCD
💡 본 문서는 '[Perception] 포인트 클라우드(Point Cloud): PCL PCD'에 대해 정리해놓은 글입니다.pointcloud에 대한 개념과 이를 활용하기 위해 필요한 내용들을 정리하였으니 참고하시기 바랍니다.1. Point CloudLidar 센서, RGB-D센서 등으로 수집되는 데이터를 의미한다. 이러한 센서들은 아래 그림처럼 물체에 빛/신호를 보내서 돌아오는 시간을 기록하여 각 빛/신호 당 거리 정보를 계산하고, 하나의 포인트(점)을 생성한다.Point Cloud 란?포인트 클라우드는 3차원 공간상에 퍼져 있는 여러 포인트(Point)의 집합(set cloud)를 의미한다.순서가 없다위치 정보를 가지고 있다 {x, y, z}종종 그 외의 정보도 가지고 있다 (Color, Refle..
[Perception] Python OpenCV를 이용한 영상 재생과 Frame Rate (FPS) 조절
💡 본 문서는 '[Perception] Python OpenCV를 이용한 영상 재생과 Frame Rate (FPS) 조절'에 대해 정리해놓은 글입니다.연속된 이미지나 비디오 파일을 다룰때 재생되는 프레임의 속도를 조절해야하는 Task가 발생하게 됩니다. 특히, 실시간으로 이미지 프로세싱을 하게 될 경우, 모든 프레임에 알고리즘을 적용하게 되면 연산으로 인해 재생이 지연되는 상황이 발생하게 됩니다. 지연시간 및 처리시간을 측정하기 위한 내용을 정리하였으니 참고하시기 바랍니다.1초 동안 10개의 프레임(이미지)이 재생되는 영상이 있다고 가정해보겠습니다. 단일 프레임 연산이 1초가 걸리는 딥러닝 알고리즘을 적용하게되면, 영상은 1초이지만 10초의 시간동안 영상이 재생되게 됩니다. 물론 모든 프레임에 대해 알..
[논문리뷰] Swin Transformer - Hierarchical Vision Transformer using Shifted Windows
ICCV 2021. [Paper] [Github] Ze Liu, Yutong Lin, Yue Cao, Han Hu, Yixuan Wei, Zheng Zhang, Stephen Lin, Baining Guo Microsoft Research Asia 25 Mar 2021 Introduction 컴퓨터 비전의 모델링은 오랫동안 CNN에 의해 지배되었다. AlexNet과 ImageNet image classification 챌린지에 대한 혁신적인 성능을 시작으로 CNN 아키텍처는 더 큰 스케일, 더 광범위한 연결, 더 정교한 convolution 형식을 통해 점점 더 강력해졌다. 다양한 비전 task를 위한 backbone 네트워크 역할을 하는 CNN과 함께 이러한 아키텍처의 발전은 전체 분야를 광범위하게 끌..
[논문리뷰] Transformer: Attention is All you need
💡 본 문서는 '[논문리뷰] Transformer: Attention is All you need'에 대해 정리해놓은 글입니다.Transformer는 최근 들어 자연어 처리와 비전 분야 모두에서 월등한 성능을 보이면서 발전하고 있다. 이러한 Transformer를 처음으로 제안한 논문이 바로 "Attention is all you need"이며, 자연어 처리를 위해 제안되었지만 최근 비전 쪽에서도 transformer를 많이 다루고, 필자도 연구에서 관련 모델을 사용해야 해서 리뷰를 한 번 해보려고한다. Abstract기존 sequence transduction model들은 인코더와 디코더를 포함한 복잡한 recurrent 나 cnn에 기반하며, 가장 성능이 좋은 모델 또한 attention mech..
[Vision] CNN Network 기본 모델 정리 (LeNet-5 부터 ResNet 까지)
💡 본 문서는 '[Perception] CNN Network의 역사 (LeNet-5 부터 ResNet 까지)'에 대해 정리해놓은 글입니다.최근에 나오는 대부분의 모델이 아직까지 ResNet으로 pretrained 된 모델을 사용하고 있다는 점에서 의아하여, ResNet 구조를 공부하고자 이전부터 ResNet까지의 CNN Nerwork의 역사를 정리하였으니 참고하시기 바랍니다.0. Multi Layer Perceptron (MLP)Multi Layer Perceptron은 다음과 같은 Layer 층으로 구성되어 있습니다.Fully Connected Layer: 입력층과 출력노드를 모두 연결한다.Batch Normalization: 각 층의 입력 데이터 분포를 일정하게 유지시킨다.Activation Fu..