Reconhecimento de objetos e cenas
Deteta pessoas, objetos, veículos, animais, textos (OCR), layout, marcas de seleção, códigos de barras e fórmulas em imagens e vídeos – com alta precisão.
Cada imagem. Cada vídeo. Cada gravação. Conhecimento estruturado.
showmi transforma dados não estruturados de foto, vídeo, áudio e documentos em informação validada e estruturada – com pontuações de confiança, referências de origem e saída conforme ao seu esquema.
Funções
Multimodal: imagens, vídeos, áudio e documentos. Baseado em esquema, com pontuações de confiança e ancoragem de origem – em conformidade com RGPD em Azure Alemanha.
Deteta pessoas, objetos, veículos, animais, textos (OCR), layout, marcas de seleção, códigos de barras e fórmulas em imagens e vídeos – com alta precisão.
Transcrição com identificação de oradores (diarização) para áudio e vídeo, com marcas de tempo – para rastreabilidade total.
Índice Markdown e vetorial de todos os conteúdos reconhecidos – imediatamente pesquisável e pronto para Retrieval-Augmented Generation.
Pesquise em linguagem natural cenas, pessoas ou situações: «Mostra todos os vídeos em que o produto X é apresentado».
Faça perguntas sobre os seus arquivos de foto, vídeo e áudio. showmi responde com referência ao fotograma, região ou marca de tempo.
showmi integra-se perfeitamente com tellmi (gravação de chamadas), talkmi (tradução), askmi (conhecimento) e notemi (documentos).
Defina os seus próprios campos por esquema JSON – extrair, classificar ou gerar. Até 1.000 campos por analisador.
Cada valor extraído vem com pontuação de confiança (0–1) e referência à origem – para processamento direto fiável.
Os vídeos são automaticamente segmentados em cenas e o conteúdo é pré-classificado – até 300 categorias por campo.
Casos de uso
showmi classifica fotos de produção (fissura, risco, descoloração) e devolve uma pontuação de confiança por achado – só os casos-limite vão para revisão manual.
Os vídeos são segmentados em cenas, os oradores identificados e o conteúdo indexado. Um clique salta para o segundo certo do vídeo.
Deteção de pessoas e veículos em gravações de câmara, com classificação e marcas de tempo – documentação à prova de auditoria em Azure Alemanha.
Uma foto mais nota de voz tornam-se um registo estruturado de sinistro: categoria, valor estimado, descrição – pronto para o seu sistema de sinistros.
Áudio e vídeo de reuniões tornam-se resumos, listas de ações, sentimento e campos KPI – com marcas de tempo como origem.
Plataforma e opções
showmi usa o serviço multimodal Foundry da Microsoft (GA, API 2025-11-01). Quatro modalidades num único pipeline – alojado em conformidade com RGPD na Alemanha.
Maior precisão para documentos e imagens complexos através de uso alargado do modelo. Disponível como complemento opcional pago.
Os limiares de segurança para ódio, violência, conteúdo sexual e automutilação podem ser ajustados – útil por exemplo para clientes particulares com requisitos próprios.
Implementação na Nuvem
100% SaaS – sem instalação
Todos os produtos funcionam inteiramente na nuvem. Sem download, sem configuração, sem necessidade de departamento de TI – basta abrir o navegador e começar.
Compatível com todos os sistemas operativos comuns:
showmi estará disponível em breve. Inscreva-se agora para acesso antecipado e ajude a moldar o produto connosco.
Sem spam. Sem partilha com terceiros. Em conformidade com RGPD.