Catégories

Neural Audio Codec par Facebook

Facebook Research a développé et publié un codec audio neuronal avec un taux de compression élevé et une qualité HiFi ICI . Le codec fonctionne en temps réel sur un processeur et atteint un taux de compression de 1,5 kbps pour la musique et de 0,9 kbps pour la parole avec une bande passante audio de 12 kHz. Il s’appuie sur des travaux antérieurs connus de longue date et sur une architecture dite CNN (Convolutional Neural Network). Les réseaux de neurones sont utilisés pour les assistants linguistiques et l’amélioration de la parole, mais n’ont pas encore trouvé beaucoup d’utilisation chez les  Radioamateurs. Puisqu’une grande partie (82^) du trafic Internet résulte de la transmission audio et vidéo, il y a un grand intérêt à développer des systèmes efficaces, c’est-à-dire. codecs hautement compressés. Avec FreeDV, il existe une méthode de transmission vocale numérique pour HF, mais elle n’utilise pas encore de codecs neuronaux. Les codecs neuronaux open source peuvent améliorer considérablement la qualité de la voix et l’utilisation des fréquences sur toutes les bandes Afu à l’avenir et offrir un large champ d’auto-construction numérique. Pour démontrer et évaluer la qualité vocale de l’EnCodec, le Dr. Matthias Jung, DL9MJ, a créé des fichiers audio avec différents facteurs de compression. ICI   . EnCodec atteint un facteur de compression allant jusqu’à 700 par rapport au fichier WAV d’origine, alors qu’un fichier MP3 standard n’a qu’un facteur 2. Les informations actuelles sont également disponibles dans le chat DARC ICI  .
Un groupe HAM sur le thème ‘l’IA Radioamateur’ est en préparation.
Auteur : Dr. Axel Richter, DM1AR / Photo : DL9MJ