Google Gemini prend désormais en charge le chargement des fichiers audio dans l’application et sur le Web

Google continue d’étendre les fonctionnalités de Gemini, et cette fois, c’est à l’audio. Après avoir pris en charge les images, les documents et les vidéos, le chatbot AI, maintenant un pilier de l’écosystème du géant de la View Mountain, introduit désormais la possibilité de charger des fichiers audio directement à partir de smartphones ou de navigateurs, une nouveauté nouvellement demandée par les utilisateurs et qui, inévitablement, ouvre la voie à de nouveaux cas d’utilisation.

Suivez Google Italia sur Telegram, recevez des nouvelles et offre d’abord

Comment fonctionne le chargement des fichiers audio dans Gemini

La fonction est déjà disponible sur Android, iOS et Web. Comme vous pouvez le voir sur nos écrans, ouvrez simplement le menu marqué par le « + » et cliquez sur « Files » à partir du mobile, ou « Fichier de charge » sur le bureau, et sélectionnez un fichier dans les formats pris en charge (MP3, M4A, WAV, etc.). Gemini sera en mesure de reconnaître le fichier audio et son contenu sans problème.

Google souligne que les limites de longueur du fichier audio varient selon le plan abonné:

  • Utilisateurs gratuits: jusqu’à 10 minutes d’audio par fichier.
  • Les abonnés sur les pros et les plans ultra: jusqu’à 3 heures de contenu audio chargé en une seule solution.

Un aspect intéressant est que Gemini vous permet de gérer l’audio comme tout autre fichier chargé: analyse, transcription automatique, résumé et même extraction de perspicacité à partir de conversations ou d’enregistrements. Une fonction qui ajoute au support déjà existant pour les vidéos, avec différentes limites (5 minutes gratuites, jusqu’à 1 heure pour les abonnés, max 2 Go).

Fichier audio de prise en charge des Gémeaux

Pas seulement audio: toutes les limites mises à jour pour les fichiers en Gémeaux

À l’occasion de l’annonce de cette nouveauté, Google en a profité pour résumer les spécifications et les limites des autres formats:

  • Fichiers génériques: jusqu’à 100 Mo chacun, avec un maximum de 10 fichiers par chat.
  • Vidéo: Max 5 minutes gratuites, 1 heure Pro / Ultra, jusqu’à 2 Go.
  • Dossiers de code ou référentiel GitHub: jusqu’à 5 000 fichiers, pour un total de 100 Mo.
  • Fichier zip: maximum 10 éléments par archive.

Dans la pratique, les Gémeaux sont de plus en plus confirmés comme une plate-forme « ouverte » pour tout type d’entrée, avec des contraintes flexibles pour ceux qui utilisent la version gratuite et des marges beaucoup plus larges pour ceux qui choisissent des abonnements.

La possibilité de charger des enregistrements vocaux, des interviews, des leçons ou des réunions représente un bond en avant dans l’utilité en béton de l’application. Si jusqu’à aujourd’hui, Gemini a souvent été considéré comme un assistant pour le texte, les images et le code, il devient maintenant également un transcripteur et un analyste du contenu audio.

Google a également souligné qu’il s’agissait de la demande la plus populaire des utilisateurs ces derniers mois: un signal de la centrale audio dans la création et la gestion du contenu récréatif et professionnel.

Les Gémeaux deviennent de plus en plus un centre universel

Avec l’arrivée de la prise en charge de l’audio, Gemini complète en fait un élément important de sa stratégie permet désormais aux utilisateurs d’interagir avec tout type de fichier sans quitter l’application. Par conséquent, non seulement plus de textes et d’invites, mais aussi des documents, des images, des vidéos et maintenant des fichiers audio.

L’intention est de transformer les Gémeaux d’un simple chatbot en un outil de productivité et une analyse universelle de tout type de fichier capable de devenir un point de référence pour chaque type d’utilisateur.