Du er ikke logget ind
Beskrivelse
Este livro explora as capacidades das redes neuronais convolucionais para lidar com uma tarefa que ? facilmente ger?vel para os humanos: perceber a pose 3D de um corpo humano a partir de v?rios ?ngulos. No entanto, na nossa abordagem, estamos limitados ? utiliza??o de um sistema de vis?o monocular. Para este efeito, ? aplicada uma abordagem de rede neural convolucional em v?deos RGB e ? alargada a convolu??es tridimensionais. Isto ? feito atrav?s da codifica??o da dimens?o temporal nos v?deos como a terceira dimens?o no espa?o convolucional, e regredindo diretamente para as posi??es das articula??es do corpo humano no espa?o de coordenadas 3D. Esta investiga??o mostra a capacidade de uma rede deste tipo para atingir o desempenho mais avan?ado no conjunto de dados Human3.6M selecionado, demonstrando assim a possibilidade de representar com ?xito dados temporais com uma dimens?o adicional na opera??o convolucional.