본문 바로가기

분류 전체보기4

AER: Auto-Encoder with Regression for Time Series Anomaly Detection 논문리뷰 * Long-term 홀터 ecg 데이터에 대한 효과적인 벡터 임베딩과 소아 심부전(especially, PSVT) 탐지(Anomaly detection)를 위한 논문 리뷰 *Abstract 최근 비지도 학습 방법들  ->  단일 타임스탬프 예측(single timestamp prediction) 또는 시계열 복원(time series reconstruction)을 이용하여 해결. 서로 보완적인 관점을 제공할 수 있음.이 논문에서는 먼저 예측 기반 방법(prediction-based)과 복원 기반 방법(reconstruction-based)의 장점과 한계를 시각적으로 보여주며 분석함. 이후, 두 방법의 장점을 결합하고 한계를 보완. AER) vanila auto-encoder 와 LSTM regresso.. 2025. 2. 13.
MotionBERT: A Unified Perspective on Learning Human Motion Representations 논문리뷰 Abstract핵심 아이디어는 2D 관찰 정보에서 3D 인간 모션을 복원하는 방식으로 학습된 모션 표현을 여러 다운스트림 task에 쉽게 적용할 수 있도록 하는 것.이를 위해 Dual-stream Spatio-temporal Transformer (DSTformer) 구조를 사용하여 인체의 관절 관계를 모델링하며, 3D 포즈 예측, 행동 인식, 그리고 인간 메시 복원 등의 태스크에서 SOTA를 달성.1. Introduction(인간의 행동을 인식하고 이해하기 위해 만든)  인간 중심의 의미론적 정보를 추정하는 다양한 task : 스켈레톤 키포인트(관절 위치 예측), 행동 클래스, 표면 메시(인체 3D 형상 복원)위와 같은 task 들이 독립적으로 발전되었으며, 서로 연결되어 다뤄지지 않았음. ex) ST.. 2025. 2. 11.
Deep Residual Learning for Image Recognition 논문리뷰 Abstract깊은 neural network에는 기본적으로 학습을 진행하는데 어려움이 있다는 단점이 있음. 그래서 residual learning frameworks를 제안해서 training의 과정을 더 쉽게 할 수 있도록 함. 이전과는 다르게 훨씬 더 깊은 네트워크를 학습했다는 것이 특징인 것으로, 별도의 residual functions를 학습할 수 있도록 해서 상대적으로 학습이 잘되고 레이어의 깊이까지 더 늘릴 수 있다는 장점이 있음. 이런 방법을 통해 layers를 152개나 늘린 결과 기존의 VGG 보다 더 단순하지만 성능은 올라간 networks를 만들었음. 이는 CIFAR-10에서도 성능의 개선을 보였음. features를 표현하는 데에 있어서  깊이는 컴퓨터 비전의 업무에서 굉장히 중요.. 2024. 5. 9.
VGG (Visual Geometry Group) 논문 리뷰 -대규모 인식 환경에서 합성곱 신경망의 깊이가 정확도에 미치는 영향에 대해서 조사.-3x3의 합성곱 필터를 사용(나중에 나오겠지만 상하좌우, 가운데의 개념이 있는 가장 작은 단위임)-깊이가 16~19일 때 최고 성능이 크게 개선.-다른 데이터셋에도 일반화가 잘됨. 1. Introduction  -최근 대규모 이미지 저장소, GPU, 대규모 분산클라스터 등의 고성능 컴퓨팅 자원이 생겨나면서 ConvNets가 도움을 받음. -ILSVRC 대회는 이미지 분류에 대한 테스트를 하기에 굉장히 좋음.-컴퓨터 비전 분야에서 ConvNets가 많이 사용되기 시작.-ConvNets은 2010년대부터 합성곱 계층의 창 크기와 보폭 등 개선방향이 있었으나, 위 논문에서는 '깊이'에 초점을 둠.  -3x3 합성곱 필터로 '깊.. 2024. 5. 2.