반응형

object 2

[PyTorch] register_hook을 사용하여 Transformer 내부의 Attention matrix(Torch.Tensor)의 gradient 받아오기

register_hook을 사용하여 Transformer 내부의 Attention matrix(Torch.Tensor)의 gradient 받아오기 모델의 파라미터에 대한 grad가 아닌, Tensor object에 대한 grad는 계산만하고 날라가버린다. 즉, loss.backward()를 통해 backpropagation을 진행하면 중간 연산에 필요한 Tensor 변수의 gradient는 .grad로 저장이 안되고 계산이 끝나면 날라간다는 말이다. 따라서 Tensor object에 register_hook 함수로 gradient를 한번 붙잡아야 한다. 붙잡는다는 말은 gradient가 계산되었을 때, 날라가도록 두는게 아니라 다른 변수에 저장해야 한다는 말이다. 나는 중간 연산의 Tensor objec..

[Object Detection] YOLO(v3)를 PyTorch로 바닥부터 구현하기 - Part 2

안녕하세요! YOLO를 PyTorch로 바닥부터 구현하기 part 2 입니다. 이 포스팅은 공부 목적으로 아래 게시글을 변역했습니다. How to implement a YOLO (v3) object detector from scratch in PyTorch: Part 2 Part 2 of the tutorial series on how to implement your own YOLO v3 object detector from scratch in PyTorch. blog.paperspace.com 바닥부터 YOLO v3 detector를 구현하는 튜토리얼의 Part 2 입니다. 지난 파트에서, YOLO가 어떻게 작동하는 지 설명했고 이번 파트에서는 YOLO에서 사용되는 layers를 PyTorch로 구현해..

반응형