본문 바로가기

728x90

Deep Learning/[논문] Paper Review38

SMPLify(Keep it SMPL): Automatic Estimation of 3D Human Pose and Shape from a Single Image SMPLify[Keep it SMPL] 이란? : 2D CNN(Deepcut)을 활용해 관절 위치를 뽑은 후, 3D SMPL에 적용해 3D Mesh를 구성하는 방식 요약(Abstract) : 이미지에서 인간의 3D 포즈와 형태를 자동으로 추정하고자 함 : CNN 기법 Deepcut을 활용, 3D SMPL의 결합 : Datasets의 경우, Leeds Spors, HumanEva, Human3.6M 사용 이점 및 특징(Introduction) : 이전 방식의 경우, 포즈 초점에만 맞췄고, 3D 형태를 무시했음 ➡️ 2D 이미지로부터 포즈와 형태를 모두 포함하는 3D 메쉬를 자동으로 추정하는 해결책을 제시함 Deepcut 활용해 2D 관절 추정 ※ DeepCut이란 📚 [참고] https://arxiv.or.. 2023. 7. 31.

SMPL: A Skinned Multi-Person Linear Model 💡 SMPL: A Skinned Multi-Person Linear Model 목차 SMPL의 정의 SMPL 연구 목적 기존의 방법 및 한계 SMPL의 원리와 작동 최종 DMPL SMPL(Skinned Multi-Person Linear) 이란? [참고] ➡️ SMPL에 대한 간단한 설명 : skinned vertex 기반의 모델로서, 다양한 인간의 체형을 현실적으로 나타내고 자연스러운 자세에 따른 변형을 취할 수 있으며 연조직 움직임을 나타낸다. ※ skinned vertex: 스킨(피부)을 씌워진 뼈구조에 속한 메시의 정점 (뼈의 움직임에 따라 변형되는 정점) SMPL 연구의 목적 : 다양한 체형을 대표할 수 있는 실제적인 애니메이션 인간 신체를 만들고, 자연스러운 자세에 따라 자연스럽게 변형되며, .. 2023. 7. 28.

DETR: End-to-End Object Detection with Transformers 📝 본 논문에서는 object detection을 direct set prediction(일대일대응)으로 정의, transformer와 bipartite matching loss를 사용한 DETR(DEtection TRansformer)을 제안함. DETR은 COCO dataset에 대하여 Faster R-CNN과 비슷한 수준의 성능을 보임 추가적으로, self-attention을 통한 global information(전역 정보)를 활용함으로써 크기가 큰 객체를 Faster R-CNN보다 훨씬 잘 포착. 📝 1. Backbone(ResNet)을 입력해서 피처맵을 추출 2. 피처맵을 1x1 conv에 입력해서 flatten한 피처맵에 대해 positional encoding 구해서 더함 ※ spatial.. 2023. 7. 23.

SRNet: Editing Text in the Wild Review 0. Abstract 본 논문에서는 자연 이미지의 텍스트 편집에 관심이 있으며, 원본 이미지의 단어를 다른 단어로 교체하거나 수정하여 원본 이미지와 시각적으로 구별하기 어려운 편집된 이미지를 유지하는 작업을 목표로 함 세 가지 모듈로 구성된 end-to-end 학습 가능한 스타일 보존 네트워크 (SRNet)를 제안 텍스트 변환 모듈: 원본 이미지의 텍스트 내용을 대상 텍스트로 변경하면서 원래의 텍스트 스타일을 유지합니다. 배경 인페인팅 모듈: 원본 텍스트를 지우고 적절한 텍스처로 텍스트 영역을 채웁니다. 퓨전 모듈: 두 모듈의 정보를 결합하여 수정된 텍스트 이미지를 생성 💡 1. Text Editing(텍스트 편집) 2. Text Synthesis(텍스트 합성) 3. Text Erasure(텍스트 삭제).. 2023. 7. 17.

Taskonomy: Disentangling Task Transfer Learning 💡 가 뭐냐? Taskonomy는 컴퓨터 비전 분야에서 다양한 작업 간의 상호 의존성을 탐구하고, 이를 통해 범용 비전 시스템을 구축하는 연구. Taskonomy는 다양한 작업들을 수행하기 위해 필요한 시각적 특징들이 서로 공유될 수 있는지를 조사하고, 이를 통해 모델의 학습 효율성과 성능을 향상시킬 수 있는 전이 학습 방법을 탐구. Taskonomy의 목표는 다양한 작업들 간에 공유 가능한 시각적 특징을 탐색하여, 작업 간의 학습과 일반화를 개선하고 작업 전환에 따른 비용과 노력을 최소화하는 것. 🍀 논문 요약: 여러 작업들 간에 공유 가능한 특징들을 발견하고 이를 활용하여 한 모델이 다양한 작업(객체 검출, 이미지 분류, 세그멘테이션)을 수행할 수 있도록 함. 이를 위해 다양한 작업들을 수행하며 수집.. 2023. 7. 16.

Noisy Student: Self-training with Noisy Student improves ImageNet classification(2019) 리뷰는 아래쪽에 있습니당 ! ! 번역 ver 0. Abstract 우리는 Noisy Student Training을 제안합니다. 이는 레이블이 풍부한 경우에도 잘 작동하는 준지도 학습 방법입니다. Noisy Student Training은 ImageNet에서 88.4%의 top-1 정확도를 달성합니다. 이는 35억 개의 약한 레이블이 부착된 Instagram 이미지가 필요한 최첨단 모델보다 2.0% 더 높은 성능입니다. 강건성 테스트 세트에서는 ImageNet-A의 top-1 정확도를 61.0%에서 83.7%로 향상시키며, ImageNet-C의 평균 손상 오차를 45.7에서 28.3으로 줄이고, ImageNet-P의 평균 뒤집기 비율을 27.8에서 12.2로 줄입니다. Noisy Student Train.. 2023. 7. 14.

이전 1 2 3 4 5 ··· 7 다음

728x90

티스토리툴바