Études supérieures - Les enseignements - Plateforme Temps Réel - Atelier Son - Cours en ligne -

Audio Numerique

le principe, les formats

- Son Analogique/Son Numérique :

L’onde sonore captée par un micro est transformée en variations de courant électrique (micro volts). Dans le domaine analogique ces variations de courant peuvent être amplifiée (augmentation du courant) pour actionner un haut parleur, enregistré sur une bande magnétique, ou gravé mécaniquement sur un disque (vinyle).

Pour passer dans le domaine numérique on utilise un Analog Digital Convertor ADC(Convertisseur analogue numérique). Pour repasser dans le domaine analogique on utilise un Digital Analog Convertor DAC.

- Échantillonnage (sampling) :

A ne pas confondre avec ce qu’on appelle samples ou « samps » : objets sonores numérisés, utilisés au cours de l’exécution musicale.

Pour comprendre comment un ordinateur représente le son on peut se référer à la façon donc le cinéma représente l’image en mouvement.
On effet l’image cinématographique est obtenue en prennant une séries d’images à une cadence rapide 24 images/second, lorsque on repasse les images fixes à la même vitesse on obtiens l’illusion d’une image en mouvement. En audio numérique on agit de la même manière en prennant une multitude d’échantillons de l’amplitude de l’onde sonore à une cadence très élevée. On les relit par la suite pour créer l’illusion d’un son continue.

À chaque pas d’échantillonnage une valeur unique est donc mémorisée. La fréquence de numérisation impose une limite fréquentielle à l’enregistrement : la fréquence maximale qui peut être enregistrée et reproduite est la moitié de la fréquence d’échantillonnage.


- Fréquence d’échantillonnage (sampling rate) :

On trouve généralement des sons numérisés échantillonnés à au moins 22050 Hz (22050 fois par second, 22 kHz en abrégé) ; la qualité CD correspond à un échantillonnage de 44100 Hz (44 kHz).

Sur un CD l’amplitude du son est donc redéfinie 44100 fois par second.
Ce qui permets l’enregistrement de fréquences de 22 kHz maximum généralement considéré comme suffisant dans la mesure au la gamme des fréquences audibles pour les humains va de 20Hz à 20000Hz (au plus).

Les nouvelles cartes audio et enregistreurs portables proposent des fréquences d’échantillonnage 96 kHz, La Vidéo numérique enregistre le son par defaut à 48 kHz.

Les fréquences au dessus de la moitié de la fréquence d’échantillonnage ( ou Nyquist rate) audibles ou non, doivent être filtres avant le ADC faute de quoi ils seront interprétés comme des fréquences non présentes dans le son d’origine (ceci ce fait au niveau de la carte son).

- Quantification :

La valeur en volts de chaque échantillon doit être traduite en valeur binaire. La précision de cette valeur (sa résolution) dépend donc du nombre de bits - 8 bits = 256 possibilités. Les variations aléatoires entre deux mesures dans ce cas sont considérables (erreur de quantification) et perceptibles sous forme distortion dans le signal audio (bruit blanc). Pour éviter des erreurs de quantification il faut augmenter le nombre de bits - Le standard CD est aujourd’hui 16 bits, cependant beaucoup de logiciels utilisent 24 voir 32 bits.

Les choix de la fréquence et de la résolution doivent venir du support finale du travail vidéo 48 kHz CD 44.1kHz. 16bits Dans le doute il vaut mieux enregistrer à un échantillonnage plus rapide et avec une meilleure résolution (24 ou 32 bits) pour ensuite baisser de qualité, plutôt que le contraire.

- Les Formats :

- Les formats non compressés :

L’enregistrement de qualité professionnelle et le montage s’effectuent on format non compressé.

.aiff
Audio Interchange file Format
Format audio PCm développé par Apple Computer pour l’enregistrement musical de haute qualité.
Également utilisé par Silicon Graphics et d’autres professionnels du son.
Peut être joué par toute une gamme d’utilitaires téléchargeables sur PC ou mAC.

.wav
Format de fichier son non compressé codé PCm. Particulier à Windows.

.snd

Aiff et Wav sont le même format PCm il n y a que le « header » (en tête) qui change l’équivalent de plain text en son. PCm (pulse code modulation) enregistre simplement les valeurs binaires issues de l’échantillonnage. Il tient beaucoup d’espace disque 1.4mbs.

- Formats compressées :

Les principes de compression audio sont compliqués à comprendre mais globalement il s’agit de faire une analyse spectrale du signal audio (mesurer les fréquences présentes), ces informations peuvent être encodées sous forme de « frames » et stocké es ou transférées de façon beaucoup plus économe que du son non compressé.

mPEG-3 - plus connu sous le nom de mP3 - est le standard de compression du son assurant à la fois une excellente qualité de reproduction et un excellent taux de compression. Cependant il est vivement recommandé de ne pas trop compresser le signal. 192 kbps est recommandé 128 kbs minimum.

Ogg Vorbis : Freeware de qualité égale voir meilleure que mP3 mais moins répandu on peut installer un plugin dans itunes pour lire du OGG.

- Choix des formats :

Graveur de CD audio : AIFF ou WAV 441OO 16bits stereo interleaved.
Exportation vers final Cut (ou d’autes logiciels vidéo) AIFF 48000 stéréo séparé.
Podcast mP3
Steaming OGG ou mP3 44100 mono max 96 kbps (kilobits par second).

- Streaming :

Osons une traduction française : « flot continu » On utilise ce qualificatif pour indiquer que des données passent très rapidement d’un dispositif à un autre de telle manière que le dispositif récepteur puisse les utiliser en même temps qu’il les reçoit, sans attendre qu’elles soient toutes arrivées. Cest le cas des échanges de données son lors d’une conversation téléphonique interactive. Ce n’est pas le cas du transfert d’une vidéo QuickTime sur Internet.

Le streaming utilise un buffer dans l’ordinateur récepteur pour «  absorber » les variations dans la réception des paquets d’information, afin de diffuser de l’audio en continue.

- Podcast :

PODCAST est la contraction de deux mots « Ipod » - le très populaire lecteur mP3 de chez Apple - et « broadcasting » qui signifie littéralement « télé diffusion ». Le podcast est donc le fait d’émettre du contenu multimédia, pour l’instant le plus souvent seulement sonore, sur un site Internet.
Pour simplifier la chose, un podcast est donc tout simplement le pendant sonore d’un article textuel comme celui que vous êtes entrain de lire. Au lieu d’écrire cet article, il aurait donc pu être enregistré sous un format audio (ex : mP3) et son contenu, remplacé par un simple lien vers le fichier sonore. En cliquant, vous l’auriez ouvert et la voix aurait remplacé la plume.

- Spatialisation :

Les Cartes multicanaux existent permettant une diffusion en multiples points. Il est également possible de sauver des fichiers multipistes (AIFF ou WAV) pour utilisation avec des cartes son multicanaux.

Dolby surround - Encodage spécial qui utilise des phénomènes de Phase pour encoder plusieurs pistes audio à partir de deux pistes seulement.

mIDI (musical Instrument Digital Interface) :

La norme mIDI comprend la description d’une interface série et d’un protocole de communication (code mIDI) permettant de faire communiquer entre eux des instruments de musique électroniques avec des ordinateurs ou d’autres machines (tables de mixage, jeux de lumières, téléphone portables etc...).

TIFF - 23.6 ko
visualisation d’un sequence MIDI ( fichier .mid)

Les fichiers mIDI ont pour extension *.mid et comportent uniquement des indications musicales : instruments - notes - sonie - tempos - etc.
Le matériel et le logiciel contenu dans chaque élément d’un ensemble mIDI interprète ces informations de manière interactive par un échange de messages.
mIDI est très largement utilisé dans les bandes sonores de jeux et studios d’enregistrement.


ESAAix - École supérieure d’art d’Aix-en-Provence - http://www.ecole-art-aix.fr