Gemini “llegeix” els teus vídeos i et dona la informació que necessites

Gemini “llegeix” els teus vídeos i et dona la informació que necessites

La nova funcionalitat d'anàlisi de vídeo de Gemini permet processar contingut audiovisual per localitzar dades, extreure conceptes clau i generar resums automàtics. A més, facilita la interrogació del contingut per obtenir respostes precises sobre tot el que passa a la pantalla i a l'àudio.
20.05.2026

Imatge inicial -

La funció d’anàlisi de vídeo de Gemini permet localitzar informació concreta en enregistraments de vídeo, com ara de conferències, webinars o tutorials extensos.

Gràcies a la seva arquitectura multimodal, Gemini no només "escolta" l'àudio, sinó que interpreta visualment el que passa a la pantalla. Això permet identificar temes principals, transcriure fragments i respondre preguntes específiques sense haver de visualitzar el vídeo sencer. 

Com funciona?

  1. Accedeix a Gemini
    Pots interactuar amb els vídeos de dues maneres:
    a. Vídeos de YouTube: simplement enganxa l'enllaç (URL) al xat.
    Gemini l'analitzarà directament.
    Limitacions: Gemini només pot analitzar vídeos públics. Si el vídeo és privat, té restriccions d'edat o conté material protegit per drets d’autor, el sistema no hi podrà accedir.
    b. Arxius propis: utilitza la icona + per carregar vídeos (MP4, MOV, etc.).
    Limitacions: si el vídeo és molt pesat (més de 2 GB) o la teva connexió és lenta, la càrrega pot fallar. En aquest cas, és millor pujar el vídeo a Google Drive i enllaçar-lo des d'allà (tingues en compte que el fitxer ocuparà espai de la teva quota d’emmagatzematge de Google Drive).
  2. Espera uns segons mentre la IA analitza l’àudio i les imatges
  3. Escriu la teva consulta
    Rebràs la resposta immediatament, amb resums, localització de fragments o explicacions concretes.
  4. Continua fent preguntes
    Pots aprofundir en el contingut, aclarir dubtes o demanar informació més específica.

Per què et pot ser útil?

  • Navegació intel·ligent i cerca directa: pregunta directament pel fragment que t'interessa sense haver d’avançar i retrocedir manualment. Pots fer preguntes concretes com ara: “En quin moment es parla d’aquest tema?” i obtenir la resposta al segon.
  • Interpretació visual avançada: analitza tot el que apareix en pantalla, fins i tot el contingut gràfic, esquemes, demostracions o explicacions visuals complexes.
  • Resums estructurats: genera síntesis clares i ben organitzades. És especialment útil per la revisió de materials densos com ara conferències, classes gravades, documentals o tutorials tècnics.

Guia d'Intel·ligència artificial generativa: Eines d’IAG


Més Bones pràctiques amb la IA