Approuvée le 30 septembre 1999 à l'issue de 4 ans de tests intensifs, la certification ITU-T Recommendation G.722.1 est devenue la nouvelle norme internationale en matière d'algorithme de compression audio à large bande. Cet algorithme utilise la technologie de compression Siren de troisième génération de Polycom et est dérivé de l'algorithme PT716plus plusieurs fois testé de Polycom. Polycom a développé cette technologie pour répondre aux besoins de la communauté multimédia en matière d'audio. Cet algorithme offre une qualité audio remarquable à faible débit binaire, ainsi qu'un court délai et une très faible complexité. Il fonctionne avec tous les types de signaux audio y compris la parole, la musique et le chant.
Siren à 16 kbit/s est une extension de la norme G.722.1 qui fonctionne à 16 kbit/s.
Vous pouvez vous procurer une version électronique de G.722.1 directement auprès de la boutique en ligne de l'ITU à l'adresse http://www.itu.int/rec/T-REC-G.722.1/en.
L'utilisation de la norme ITU-T Recommendation G.722.1 se fait sous réserve de la concession d'un accord de licence par Polycom.
La norme ITU-T Recommendation G.722.1 inclut les éléments suivants :
Pour commencer, achetez une copie de l'algorithme G.722.1 auprès de l'ITU-T. La norme ITU-T Recommendation G.722.1 contient toutes les informations nécessaires pour mettre en œuvre l'algorithme. Les signaux de sortie provenant d'une mise en œuvre de G.722.1 quel que soit le matériel utilisé doivent correspondre exactement à ceux du code C de référence lorsque des signaux d'entrée identiques sont traités. Les vecteurs tests fournis avec la norme servent à vérifier si la mise en œuvre a été correctement réalisée.
Des vecteurs tests d'entrée et de sortie permettent de vérifier la mise en œuvre de l'encodeur et du décodeur. Ces vecteurs tests ont été conçus de manière à utiliser le plus possible le code de l'algorithme. De ce fait, si une mise en œuvre parvient à reproduire les vecteurs tests de sortie, on considère qu'elle est capable de reproduire aussi correctement la performance du code C de référence.
SirenZip est un programme qui fonctionne sur Microsoft Windows 95 ou les versions ultérieures du système d'exploitation Microsoft Windows. Il exécute G.722.1 à l'un des trois débits possibles (16 000 kbit/s, 24 000 kbit/s ou 32 kbit/s). Télécharger une version de démonstration gratuite de SirenZip (208 Ko).
Comment utiliser SirenZip
Dans la norme de l'ITU-T, l'algorithme G.722.1 est spécifié comme étant en virgule fixe. Une version en virgule flottante sera normalisée dans un deuxième temps par l'ITU-T et sera compatible avec la norme en virgule fixe. (Une version en virgule flottante compatible est déjà disponible auprès de Polycom.) Les valeurs de complexité en MIP indiquées ci-dessous sont des exemples de mises en œuvre non optimisées sur trois processeurs de signaux numériques différents. Notez que deux de ces processeurs affichent des unités en virgule flottante.
Paramètres généraux de G.722.1
Paramètre |
Valeur |
|---|---|
Vitesse d'échantillonnage de l'audio |
16 kHz |
Débit (susceptible de changer sur n'importe quelle limite de trame) |
16, 24, 32 kbit/s (16 kbit/s est une extension Polycom de la norme) |
Bande passante audio |
50 Hz à 7 kHz. |
Taille de trame audio |
20 ms |
Délai algorithmique (voir Remarque 1) |
40 ms |
RAM (virgule fixe) |
< 7,5 ko |
Espace de tableau ROM (virgule fixe) |
~ 20 Ko |
Rapport MIP entre l'encodeur et le décodeur |
d'environ 1 sur 1 |
Exemples de valeurs MIP pour divers processeurs
Processeur |
MIP (encodage + décodage) |
|---|---|
TI TMS320C50 |
13,9 (= 6,95 + 6,95) (code non optimisé pour G.722.1 en virgule fixe) |
TriMedia TM 1300 |
4 (= 2 + 2) (mise en œuvre en virgule flottante) |
TI TMS320C31 |
9,25 (= 4,51 + 4,51) (mise en œuvre en virgule flottante) |
La téléphonie classique est appelée « bande étroite » car elle transmet les signaux audio uniquement sur la plage de fréquence comprise entre 300 et 3 500 Hz, soit une bande passante de tout juste 3,2 kHz. Cette bande passante étroite donne aux appels téléphoniques cette sonorité « métallique » caractéristique, comparé au son de large bande plus riche des systèmes haute fidélité. G.722.1 fournit une bande passante audio de 7 kHz (50 à 7 000 Hz), ce qui représente une nette amélioration, et se rapproche de la qualité d'une radio FM par opposition à un téléphone traditionnel. En termes de qualité audio, la large bande s'impose à l'unanimité par rapport à la bande étroite.
Par exemple, dans une conversation téléphonique, n'avez-vous jamais confondu les mots « sont » et « font » ? Les sons « f » et « s » se confondent facilement car leur intelligibilité est perdue lorsque les fréquences élevées ne sont pas parfaitement rendues. Une telle confusion ne risque pas de se produire avec un codage utilisant une large bande, car toutes les fréquences requises pour la parole sont intégralement représentées.
Avec la large bande, toute l'expérience audio est bien plus naturelle et agréable à entendre.
G.722.1 est également capable de reproduire la musique de façon exceptionnelle à des débits qui n'ont jamais été aussi faibles. Aucune comparaison possible avec la radio AM.
Exemples d'application de G.722.1 et Siren à 16 kbit/s :
La téléphonie sur IP, la visioconférence et l'audioconférence ont des besoins audio très similaires : une qualité audio élevée pour une latence et une complexité faibles. Par ailleurs, la capacité à modifier le débit pour prendre en considération des spécificités propres aux canaux est indispensable. G.722.1 accepte une variation du débit de 24, 32 ou 16 kbit/s (extension Siren) sur n'importe quelle limite de trame de 20 ms.
Dans les applications de streaming, une complexité réduite et un coût relativement bas côté client sont deux conditions de base. G.722.1 remplit ces deux conditions sans sacrifier la qualité. Les débits 16, 24 et 32 kbit/s permettent aux clients de bénéficier d'une qualité audio exceptionnelle même avec des connexions par modem (56 kbit/s).
La messagerie est une application de stockage et de transfert. Une complexité limitée signifie une mise en œuvre du matériel peu onéreuse. La compression audio haute qualité garantit un excellent rendu du clip musical ou de la voix de l'expéditeur.
Téléchargez ces fichiers .WAV pour écouter et juger par vous-même de la qualité de l'algorithme G.722.1.
(Notez que ces fichiers sont des fichiers .WAV non compressés compatibles avec n'importe quel ordinateur. Il est possible de les lire sans le codec G.722.1, mais de par leur nature, le téléchargement prend un certain temps.)
Fichiers de parole |
Télécharger |
|---|---|
Bande passante audio 3,5 kHz, POTS de qualité |
|
Bande passante audio 7 kHz, codée à 16 kbit/s avec Siren |
|
Bande passante audio 7 kHz, codée à 24 kbit/s avec G.722.1 |
|
Bande passante audio 7 kHz, codée à 32 kbit/s avec G.722.1 |
|
Fichiers de musique |
Télécharger |
|---|---|
Bande passante audio 3,5 kHz, POTS de qualité |
|
Bande passante audio 7 kHz, codée à 16 kbit/s avec Siren |
|
Bande passante audio 7 kHz, codée à 24 kbit/s avec G.722.1 |
|
Bande passante audio 7 kHz, codée à 32 kbit/s avec G.722.1 |
|
A savoir que Siren fonctionne parfaitement bien même en bas débit (par exemple, pour une connexion par modem commuté avec un débit compris entre 28,8 et 56 kbit/s). Ecoutez les échantillons de comparaison :
Bande passante audio 14 kHz Siren à 22 kbit/s par rapport à Windows Media Player (prend en charge uniquement une vitesse d'échantillonnage de 44 kHz à 22 kbit/s)*.
Débit |
Télécharger |
Télécharger |
|---|---|---|
22 kbit/s |
*La bande passante de Windows Media Player dépend de ce qui est autorisé par le débit. Une vitesse d'échantillonnage de 44 kHz autorise uniquement une bande passante de 20 kHz.
Bande passante audio 14 kHz Siren à 24 kbit/s par rapport au MP3 (bande passante audio de 11 kHz maximum à 24 kbit/s)
Débit |
Télécharger |
Télécharger |
|---|---|---|
24 kbit/s |
Pour que l'équipement de divers fournisseurs soit compatible avec l'algorithme G.722.1, il est nécessaire de normaliser l'échange de compatibilité et la sélection de mode de l'algorithme G.722.1. Ces considérations techniques pour les systèmes H.320, H.323, and H.324 ont été définies par le groupe d'étude 16 de l'ITU-T.
Les détenteurs de licences recevront toutes les instructions nécessaires pour négocier l'utilisation de G.722.1 conformément aux normes de l'ITU-T, ainsi que les procédures de négociation et d'échange de compatibilités en vue d'une prise en charge par les fournisseurs de l'extension 16 kbit/s de Polycom de la norme.
L'ITU est l'Union internationale des télécommunications (International Telecommunications Union) et a son siège à Genève en Suisse. Fondé en 1865, c'est l'organisme de traités internationaux le plus ancien au monde. Désormais rattaché aux Nations Unies, il est chargé de la normalisation de la technologie dans le domaine des télécommunications internationales, incluant le téléphone, la radio et les communications de données. Pour plus d'informations, rendez-vous sur le site Internet de l'ITU à l'adresse : http://www.itu.int.
Pour plus d'informations techniques, contactez-nous à l'adresse : SirenInfo@polycom.com
Le programme de licence et un modèle d'accord de licence sont disponibles à la section : Calendrier de paiement de licence et Conditions de licence