
Contagem de Pessoas em Tempo Real com YOLOv12 e Centroid Tracker
Fala, meu povo! Tava lendo um artigo interessante lá no site PyImageSearch outro dia sobre um assunto que sempre rende: monitoramento de fluxo de pessoas. Sabe, contar quem entra e sai de um lugar? Parece simples, mas em tempo real, usando visão computacional, tem seus detalhes. E o legal é que eles usaram uma combinação que faz todo sentido pra soluções práticas: o novo YOLOv12 e um tracker chamado Centroid Tracker.
Por Que Monitorar Fluxo de Pessoas Importa?
Antes de mergulhar na tech, vamos falar de negócio. Por que alguém gastaria tempo e recurso pra fazer isso? Simples: dados! Em shopping, estação de metrô, portaria de prédio, saber quantas pessoas passam, em que horários, ajuda a otimizar equipe, planejar segurança, entender o movimento. É o tipo de IA que vai direto pro balcão, que gera insight acionável. Menos achismo, mais dados, como a gente gosta aqui.
A Dupla Dinâmica: YOLOv12 e Centroid Tracker
A ideia por trás dessa solução que vi no artigo do Vikram Singh é casar duas coisas:
O Detector: YOLOv12
O YOLOv12 é essa galera nova na família YOLO, que já era rápida pra achar objetos, mas agora ficou ainda mais esperta com uns truques de 'atenção' (sim, aquele conceito dos Transformers chegando mais forte na visão). Isso significa que ele consegue ver quem é 'pessoa' no vídeo de forma bem eficiente e rápida. Pensa nele como o 'olheiro' do sistema.
O Rastreio: Centroid Tracker
Aqui tá o truque principal pra rastrear, e é onde a simplicidade brilha. O Centroid Tracker não é super complexo, não precisa de modelos de movimento mirabolantes (tipo Filtros de Kalman, que são ótimos, mas às vezes over-engineering pra certas tarefas). A lógica é simples:
- O YOLOv12 detecta um monte de caixinhas (bounding boxes) de 'pessoa'.
- Pra cada caixinha, a gente calcula o centro dela - o centróide. É só o ponto médio X e Y.
- O tracker 'lembra' os centróides das pessoas que ele já viu.
- No próximo frame, ele vê os novos centróides detectados e tenta casar eles com os antigos, procurando quem tá mais perto. É tipo "Ah, esse ponto aqui no frame atual tá pertinho de onde tava a 'Pessoa ID 5' no frame anterior? Então deve ser a mesma pessoa!"
- Se acha um centróide novo que não casa com ninguém, registra como 'Pessoa ID 6' (nova entrada).
- Se uma 'Pessoa ID X' sumiu por alguns frames, ele para de rastrear (desregistra).
É um tracker simples, eficaz pra cenários onde as pessoas não ficam se trombando ou escondendo atrás umas das outras o tempo todo. Rápido de implementar e leve pra rodar.
A Lógica da Contagem: A Linha Mágica
Tá, mas como conta quem entrou e quem saiu? O artigo explica um jeito prático: desenha uma linha horizontal virtual no meio da tela. Se o centríode de uma pessoa rastreada cruza essa linha de cima pra baixo, conta como ENTRADA. Se cruza de baixo pra cima, conta como SAÍDA.
Pra não contar a mesma pessoa várias vezes, a gente marca a ID dela num conjunto ('set' em Python) assim que ela cruza a linha em uma direção. Isso garante que a ID só seja contada uma vez por travessia completa.
Montar soluções assim, juntando detecção rápida e precisa (YOLOv12) com um método de rastreio simples e inteligente (Centroid Tracker) e uma lógica clara de contagem (a linha imaginária), é algo que discutimos bastante na nossa comunidade IA Overflow. Se você curte botar a mão na massa e trocar ideia sobre essas implementações práticas que resolvem problemas reais, essa é a sua praia. Aliás, se você quiser trocar ideia sobre estratégias assim, clica no link para entrar em contato e entre na comunidade IA Overflow.
Os Desafios Reais (Porque Nem Tudo É Perfeito)
O próprio artigo mostra isso em um dos exemplos visuais: nem sempre 100% das pessoas são detectadas logo de cara. Se uma pessoa passa muito perto da outra, ou se a câmera pega só um pedaço dela, o detector (YOLOv12) pode não ter confiança suficiente naquele frame pra gerar uma detecção. O tracker só consegue rastrear o que o detector "vê".
Isso é super normal em sistemas de visão computacional na vida real. Os modelos melhoram a cada dia, mas a oclusão (gente uma na frente da outra), a qualidade da imagem, o ângulo da câmera, tudo isso influencia. Por isso que falo: em Deus nós confiamos, o resto me tragam dados (e cenários de teste variados!).
Conclusão
No final das contas, com um bom detector como o YOLOv12 (que tá trazendo novidades com essa arquitetura híbrida) e um tracker inteligente e simples como o Centroid Tracker, dá pra resolver um problema bem comum de negócio de forma elegante e eficiente. Pegando um vídeo de cima, você consegue um sistema de contagem e monitoramento de fluxo que te dá dados valiosos.
É mais um exemplo de como a gente pode usar IA de ponta pra sair da teoria e resolver BOs práticos do dia a dia das empresas. Essa é a beleza da coisa!