O glaucoma é uma das principais causas de cegueira irreversível no mundo, caracterizado por danos progressivos ao nervo óptico. A detecção precoce é essencial para evitar a perda da visão, no entanto, o diagnóstico manual baseado em imagens retinianas pode ser subjetivo, demorado e propenso a erros. Nesse contexto, técnicas de aprendizado profundo vêm se destacando como alternativas promissoras para auxiliar profissionais de saúde na triagem e diagnóstico da doença. Este estudo propõe um método híbrido composto por duas etapas principais: (i) detecção do disco óptico utilizando o modelo YOLOv8n, e (ii) classificação do glaucoma a partir da região identificada, por meio de uma ResNet-50 refinada. A pesquisa foi conduzida utilizando a base SMDG-19, que é formada pela mesclagem de 19 conjuntos de dados públicos contendo 12.449 imagens retinianas, garantindo diversidade e consistência na avaliação experimental. O pipeline desenvolvido alcançou resultados expressivos, com 91,7% de precisão, 91,1% de recall, 91,5% de acurácia e 82,7% no coeficiente kappa, evidenciando sua robustez para aplicações clínicas. Uma das principais contribuições do estudo foi demonstrar que o uso da imagem completa da retina apresentou desempenho superior em comparação ao uso restrito da região do disco óptico, o que foi confirmado pela análise de ativação via Grad-CAM, que permitiu interpretar o foco do modelo durante as predições.