본문 바로가기

AI/CNN+LSTM

(3)
[3DCNN] CSN: Video Classification with Channel-Separated Convolutional Networks 논문 리뷰 참고 자료 : Group Convolution : AlexNet 참조 / Depth Convolution : MobileNet 참조 Group Convolution : https://aifpga.tistory.com/entry/Grouped-Convolution-Dilated-Convolution Regulation : https://daeson.tistory.com/184 Grouped Convolution, Dilated Convolution Intro CNN 을 실제 HW 로 구현하려면 엄청난 MAC 량을 마주할 수 밖에 없습니다. 이는 빠른 detection 이 가능하다고 했던 YOLO 에서도 마찬가지 입니다. 하여 현업에서 네트워크를 학습 및 구현하려고 할 aifpga.tistory.com 18..
[3DCNN] TSM: Temporal Shift Module for Efficient Video Understanding 해석 리뷰 ABSTRACT 폭발적인 비디오 스트리밍의 증가는 비디오 understanding에 대한 높은 정확도와 낮은 계산비용에 도전을 불러왔다. 2D CNN은 계산비용이 적지만 시간적인 정보는 가져오지 못한다; 3D CNN은 계산집약적이여서 비용이 만만찮다. 따라서 위 논문에서는 일반적이고 효과적인 Temporal Shift Module 을 고성능과 고효율 모델로 추천한다. TSM은 2d의 복잡도로 3D의 퍼포먼스를 낸다. 전형적인 서론... TSM은 시간축을 따라 채널의 일부를 이동시킨데 이것 덕분에 인접 프레임과 정보 교환이 쉬워진다. It can be inserted into 2D CNNs to achieve temporal modeling at zero computation and zero paramet..
[AI / 논문리뷰] TS-LSTM and Temporal-Inception: Exploiting Spatiotemporal Dynamics for Activity Recognition 1편 보호되어 있는 글입니다.