Comparatif rapide
Retranscrire une interview, un podcast, une réunion ou un cours audio à la main prend un temps considérable. Les logiciels de retranscription automatique transforment un fichier audio en texte en quelques minutes, avec une précision qui s’est considérablement améliorée grâce à l’intelligence artificielle. Ce qui prenait des heures se fait maintenant en minutes.
Plusieurs solutions gratuites ou freemium sont disponibles, avec des performances très variables selon la langue, la qualité audio et le contexte. Voici notre comparatif des 5 meilleurs logiciels de retranscription audio gratuits, testés sur des contenus en français.
En bref
- Meilleur open source — Whisper (OpenAI)
- Meilleur temps réel — Otter.ai
- Meilleur simple en ligne — Transkriptor
- Meilleur édition audio — Descript
- Whisper (OpenAI) — modèle IA open source, précision remarquable, 90+ langues
- Otter.ai — transcription en temps réel, résumé automatique, idéal pour les réunions
- Transkriptor — service en ligne simple, version gratuite avec minutes limitées
- Descript — éditeur audio/vidéo avec transcription intégrée, très polyvalent
- Google Docs Voice — dictée vocale gratuite, sans installation, intégrée à Google
Les 5 meilleurs logiciels de retranscription audio gratuits en détail
1. Whisper (OpenAI)
Whisper est le modèle de reconnaissance vocale open source publié par OpenAI. Disponible gratuitement, il s’installe localement sur votre ordinateur et traite vos fichiers audio sans envoyer de données sur des serveurs externes. La précision est parmi les meilleures disponibles : le modèle large-v3 atteint des taux de précision remarquables sur des audios de qualité correcte en français.
Whisper supporte plus de 90 langues, peut transcrire et traduire simultanément, et génère des timestamps par segment. Pour les professionnels qui traitent des contenus confidentiels (interviews, réunions sensibles), c’est la solution idéale : tout se passe en local, aucune donnée ne quitte votre machine.
Point faible : Whisper s’utilise en ligne de commande, ce qui peut décourager les utilisateurs non techniques. Des interfaces graphiques gratuites comme Whisper Desktop ou Buzz simplifient l’usage, mais l’installation reste moins immédiate qu’une application web. Les modèles les plus précis nécessitent aussi un ordinateur puissant.
2. Otter.ai
Otter.ai est la référence pour la transcription de réunions en temps réel. L’outil s’intègre avec Zoom, Microsoft Teams et Google Meet pour transcrire automatiquement pendant que la réunion se déroule. À la fin, un résumé automatique identifie les points clés, les décisions et les actions à mener. Pour les équipes en télétravail, c’est un gain de temps concret.
La version gratuite offre 300 minutes de transcription par mois, ce qui couvre 2 à 3 heures de réunion. Les transcriptions sont conservées et consultables dans l’historique. La recherche dans les transcriptions permet de retrouver rapidement un passage précis d’une réunion passée.
Point faible : Otter.ai est principalement optimisé pour l’anglais. La qualité de transcription en français est nettement inférieure. Pour des réunions ou interviews en français, Whisper ou Transkriptor donneront de meilleurs résultats. La version gratuite est aussi limitée en partage et en export.
3. Transkriptor
Transkriptor est un service en ligne simple et accessible. Vous uploadez un fichier audio ou vidéo, sélectionnez la langue, et la transcription est prête en quelques minutes. L’interface est claire, sans configuration technique. Les formats supportés sont nombreux : MP3, MP4, WAV, M4A, et même les liens YouTube.
La version gratuite propose quelques minutes gratuites à l’inscription pour tester la qualité. Le résultat est un texte éditable directement dans l’interface, avec possibilité d’export en TXT, DOCX ou SRT (sous-titres). Pour une transcription ponctuelle sans installation, c’est la solution la plus rapide à utiliser.
Point faible : la version gratuite est très limitée en volume. Pour un usage régulier, l’abonnement est nécessaire. Le tarif est plus élevé que la concurrence pour un volume équivalent. La précision sur des audios bruités ou avec plusieurs locuteurs peut décevoir.
4. Descript
Descript est bien plus qu’un simple outil de transcription : c’est un éditeur audio et vidéo complet où vous éditez le son en modifiant le texte. Supprimez un passage de votre podcast en effaçant les mots correspondants dans la transcription, et Descript ajuste automatiquement l’audio. C’est une approche radicalement différente et très efficace pour les créateurs de contenu.
La transcription est automatique à l’import, avec une bonne qualité sur l’anglais et un support correct du français. La version gratuite offre 1 heure de transcription par mois, ce qui convient pour tester l’outil ou pour un usage ponctuel.
Point faible : Descript est d’abord un outil d’édition audio/vidéo, pas un outil de transcription pure. Si vous voulez juste convertir un audio en texte, Whisper ou Transkriptor sont plus adaptés. L’application est lourde à installer et la courbe d’apprentissage est plus longue que les alternatives web.
5. Google Docs Voice
La dictée vocale de Google Docs est la solution la plus accessible : elle est gratuite, ne demande aucune installation et fonctionne directement dans le navigateur avec un compte Google. Ouvrez un document, activez la dictée depuis le menu Outils, et commencez à parler. Le texte s’affiche en temps réel avec une ponctuation automatique.
Pour retranscrire un fichier audio existant, il faut jouer le fichier dans vos haut-parleurs et capturer le son via le microphone de l’ordinateur, ce qui donne des résultats variables selon la qualité de la diffusion. C’est une solution de dépannage efficace pour des besoins occasionnels sans budget.
Point faible : Google Docs Voice est conçu pour la dictée en direct, pas pour la retranscription de fichiers. La qualité sur des enregistrements anciens ou bruités est médiocre. Pas d’export SRT, pas de timestamps, pas de gestion des locuteurs multiples. Pour un usage professionnel, Whisper ou Otter.ai sont nettement supérieurs.
Pour qui ?
Journalistes et chercheurs : Whisper pour sa précision et sa confidentialité. Les interviews sensibles ne quittent pas votre ordinateur.
Equipes en réunion : Otter.ai pour la transcription en temps réel et les résumés automatiques, principalement pour les réunions en anglais.
Créateurs de podcasts et vidéastes : Descript pour éditer le contenu directement depuis la transcription.
Etudiants et particuliers : Transkriptor ou Google Docs Voice pour des besoins ponctuels sans investissement.
Tableau comparatif
| Logiciel | Note /10 | Gratuit | Français | Temps réel |
|---|---|---|---|---|
| Whisper | 9/10 | Oui | Excellent | Non |
| Otter.ai | 8/10 | 300 min/mois | Moyen | Oui |
| Transkriptor | 7,5/10 | Très limité | Bon | Non |
| Descript | 8/10 | 1h/mois | Bon | Non |
| Google Docs Voice | 6,5/10 | Oui | Bon | Oui |
Comment choisir ?
Confidentialité : si vos enregistrements contiennent des informations sensibles, Whisper est la seule solution qui traite tout localement sans envoi sur des serveurs tiers.
Volume et fréquence : pour un usage régulier avec de nombreuses heures d’audio, Whisper ou un abonnement Otter.ai/Transkriptor. Pour quelques minutes par mois, les versions gratuites suffisent.
Format de sortie : si vous avez besoin de fichiers SRT pour des sous-titres, vérifiez que l’outil choisi exporte dans ce format. Whisper et Descript le supportent nativement.
FAQ : logiciels de retranscription audio
Oui, Whisper est un modèle open source publié par OpenAI, gratuit à utiliser. Il s’installe localement sur votre ordinateur. Des interfaces graphiques gratuites comme Whisper Desktop facilitent son utilisation sans ligne de commande.
Whisper supporte plus de 90 langues dont le français avec une bonne précision. Otter.ai est principalement optimisé pour l’anglais. Transkriptor et Descript supportent le français mais avec des résultats variables selon la qualité audio.
Whisper large-v3 atteint une précision de 85-92% sur un audio français de qualité correcte. Les accents régionaux et le vocabulaire technique peuvent réduire cette précision. Une relecture reste recommandée pour les documents importants.
Oui. Otter.ai s’intègre nativement avec Zoom et Teams pour une transcription en temps réel. Whisper et Transkriptor peuvent transcrire l’enregistrement de la réunion après coup.
Whisper traite les fichiers localement sur votre ordinateur : aucune donnée n’est envoyée sur des serveurs externes, ce qui en fait la solution la plus sécurisée pour les contenus confidentiels. Les solutions en ligne (Otter.ai, Transkriptor) envoient vos fichiers sur leurs serveurs.