Jump to content

FAQ sur Polycom® Siren/G.722.1

Contact

Qu'est-ce que l'algorithme G.722.1 ?

Approuvée le 30 septembre 1999 à l'issue de 4 ans de tests intensifs, la certification ITU-T Recommendation G.722.1 est devenue la nouvelle norme internationale en matière d'algorithme de compression audio à large bande. Cet algorithme utilise la technologie de compression Siren de troisième génération de Polycom et est dérivé de l'algorithme PT716plus plusieurs fois testé de Polycom. Polycom a développé cette technologie pour répondre aux besoins de la communauté multimédia en matière d'audio. Cet algorithme offre une qualité audio remarquable à faible débit binaire, ainsi qu'un court délai et une très faible complexité. Il fonctionne avec tous les types de signaux audio y compris la parole, la musique et le chant.

Haut de page

Qu'est-ce que Siren à 16 kbit/s ?

Siren à 16 kbit/s est une extension de la norme G.722.1 qui fonctionne à 16 kbit/s.

Haut de page

Comment obtenir la certification ITU-T Recommendation G.722.1 ?

Vous pouvez vous procurer une version électronique de G.722.1 directement auprès de la boutique en ligne de l'ITU à l'adresse http://www.itu.int/rec/T-REC-G.722.1/en.

L'utilisation de la norme ITU-T Recommendation G.722.1 se fait sous réserve de la concession d'un accord de licence par Polycom.

Haut de page

Que contient exactement la certification ITU-T Recommendation G.722.1 ?

La norme ITU-T Recommendation G.722.1 inclut les éléments suivants :

  • Description de l'algorithme de codage à large bande.
  • Code C de référence pour l'encodeur et le décodeur.
  • Vecteurs (ou signaux) tests, qui permet de vérifier la précision de la mise en œuvre de l'algorithme.

Haut de page

Comment puis-je mettre en œuvre l'algorithme G.722.1 ?

Pour commencer, achetez une copie de l'algorithme G.722.1 auprès de l'ITU-T. La norme ITU-T Recommendation G.722.1 contient toutes les informations nécessaires pour mettre en œuvre l'algorithme. Les signaux de sortie provenant d'une mise en œuvre de G.722.1 quel que soit le matériel utilisé doivent correspondre exactement à ceux du code C de référence lorsque des signaux d'entrée identiques sont traités. Les vecteurs tests fournis avec la norme servent à vérifier si la mise en œuvre a été correctement réalisée.

Des vecteurs tests d'entrée et de sortie permettent de vérifier la mise en œuvre de l'encodeur et du décodeur. Ces vecteurs tests ont été conçus de manière à utiliser le plus possible le code de l'algorithme. De ce fait, si une mise en œuvre parvient à reproduire les vecteurs tests de sortie, on considère qu'elle est capable de reproduire aussi correctement la performance du code C de référence.

Haut de page

Télécharger une démo de l'algorithme G.722.1

SirenZip est un programme qui fonctionne sur Microsoft Windows 95 ou les versions ultérieures du système d'exploitation Microsoft Windows. Il exécute G.722.1 à l'un des trois débits possibles (16 000 kbit/s, 24 000 kbit/s ou 32 kbit/s). Télécharger une version de démonstration gratuite de SirenZip (208 Ko).

Comment utiliser SirenZip

  • Une fois le téléchargement terminé, SirenZip est prêt à être exécuté.
  • Cliquez deux fois sur le fichier SirenZip.exe, puis cliquez sur Siren Encode (Compression Siren) et saisissez les noms de fichier corrects de la source audio et du train de bits de sortie. Sélectionnez le débit binaire qui convient, puis cliquez sur Play Wav Input (Lire l'entrée Wav) pour écouter le fichier d'entrée, ou sur Encode Wave Input (Compresser l'entrée Wav) pour compresser le fichier à l'aide de G.722.1.
  • Pour décoder, cliquez sur Siren Decode (Décompression Siren) et saisissez les noms de fichier corrects de la source du train de bits et de la sortie audio. Cliquez ensuite sur Play Wav Output (Lire la sortie Wav) pour écouter le fichier de sortie compressé avec G.722.1, ou cliquez sur Decode Bitstream (Décompresser le train de bits) pour synthétiser la sortie audio à l'aide de G.722.1.
  • Quelques points à retenir lorsque vous utilisez SirenZip :
    • L'encodeur prend en charge les fichiers d'entrée audio au format mono wave.
    • Le décodeur reproduit les fichiers audio au format mono wave.
    • Le débit binaire peut être défini dans l'encodeur ; le décodeur connaît alors automatiquement le débit binaire à utiliser.
    • Les fichiers d'entrée audio de plus de 60 secondes seront coupés après 60 secondes.
    • L'entrée audio peut avoir un ou deux débits binaires, 16 000 Hz ou 22 050 Hz. Si l'entrée est échantillonnée à 22 050 Hz, elle sera ré-échantillonnée à 16 kHz par SirenZip, ce qui risque d'altérer la fidélité de l'audio. Il est conseillé d'utiliser l'échantillonnage 16 kHz chaque fois que possible.

Haut de page

Caractéristiques techniques

Dans la norme de l'ITU-T, l'algorithme G.722.1 est spécifié comme étant en virgule fixe. Une version en virgule flottante sera normalisée dans un deuxième temps par l'ITU-T et sera compatible avec la norme en virgule fixe. (Une version en virgule flottante compatible est déjà disponible auprès de Polycom.) Les valeurs de complexité en MIP indiquées ci-dessous sont des exemples de mises en œuvre non optimisées sur trois processeurs de signaux numériques différents. Notez que deux de ces processeurs affichent des unités en virgule flottante.

Paramètres généraux de G.722.1

Paramètre

Valeur

Vitesse d'échantillonnage de l'audio

16 kHz

Débit (susceptible de changer sur n'importe quelle limite de trame)

16, 24, 32 kbit/s (16 kbit/s est une extension Polycom de la norme)

Bande passante audio

 

50 Hz à 7 kHz.

Taille de trame audio

 

20 ms

Délai algorithmique (voir Remarque 1)

 

40 ms

 

RAM (virgule fixe)

 

< 7,5 ko

Espace de tableau ROM (virgule fixe)

 

~ 20 Ko

 

Rapport MIP entre l'encodeur et le décodeur

 

d'environ 1 sur 1

 

Exemples de valeurs MIP pour divers processeurs

 

Processeur

MIP (encodage + décodage)

TI TMS320C50

 

13,9 (= 6,95 + 6,95) (code non optimisé pour G.722.1 en virgule fixe)

 

TriMedia TM 1300

 

4 (= 2 + 2) (mise en œuvre en virgule flottante)

 

TI TMS320C31

9,25 (= 4,51 + 4,51) (mise en œuvre en virgule flottante)

 

Haut de page

Pourquoi choisir la large bande ?

La téléphonie classique est appelée « bande étroite » car elle transmet les signaux audio uniquement sur la plage de fréquence comprise entre 300 et 3 500 Hz, soit une bande passante de tout juste 3,2 kHz. Cette bande passante étroite donne aux appels téléphoniques cette sonorité « métallique » caractéristique, comparé au son de large bande plus riche des systèmes haute fidélité. G.722.1 fournit une bande passante audio de 7 kHz (50 à 7 000 Hz), ce qui représente une nette amélioration, et se rapproche de la qualité d'une radio FM par opposition à un téléphone traditionnel. En termes de qualité audio, la large bande s'impose à l'unanimité par rapport à la bande étroite.

Par exemple, dans une conversation téléphonique, n'avez-vous jamais confondu les mots « sont » et « font » ? Les sons « f » et « s » se confondent facilement car leur intelligibilité est perdue lorsque les fréquences élevées ne sont pas parfaitement rendues. Une telle confusion ne risque pas de se produire avec un codage utilisant une large bande, car toutes les fréquences requises pour la parole sont intégralement représentées.

Avec la large bande, toute l'expérience audio est bien plus naturelle et agréable à entendre.

G.722.1 est également capable de reproduire la musique de façon exceptionnelle à des débits qui n'ont jamais été aussi faibles. Aucune comparaison possible avec la radio AM.

Haut de page

Applications

Exemples d'application de G.722.1 et Siren à 16 kbit/s :

  • Téléphonie sur IP à large bande
  • Flux audio (musique comprise) sur Internet
  • Visioconférence
  • Audioconférence
  • Lecture de support audio (par ex., enregistreurs)
  • Stockage et transmission de messages (par ex., boîte vocale)
  • Audio sur site Internet

La téléphonie sur IP, la visioconférence et l'audioconférence ont des besoins audio très similaires : une qualité audio élevée pour une latence et une complexité faibles. Par ailleurs, la capacité à modifier le débit pour prendre en considération des spécificités propres aux canaux est indispensable. G.722.1 accepte une variation du débit de 24, 32 ou 16 kbit/s (extension Siren) sur n'importe quelle limite de trame de 20 ms.

Dans les applications de streaming, une complexité réduite et un coût relativement bas côté client sont deux conditions de base. G.722.1 remplit ces deux conditions sans sacrifier la qualité. Les débits 16, 24 et 32 kbit/s permettent aux clients de bénéficier d'une qualité audio exceptionnelle même avec des connexions par modem (56 kbit/s).

La messagerie est une application de stockage et de transfert. Une complexité limitée signifie une mise en œuvre du matériel peu onéreuse. La compression audio haute qualité garantit un excellent rendu du clip musical ou de la voix de l'expéditeur.

Haut de page

Ecoutez un échantillon audio de G.722.1 et Siren à 16 kbit/s et jugez par vous-même.

Téléchargez ces fichiers .WAV pour écouter et juger par vous-même de la qualité de l'algorithme G.722.1.

(Notez que ces fichiers sont des fichiers .WAV non compressés compatibles avec n'importe quel ordinateur. Il est possible de les lire sans le codec G.722.1, mais de par leur nature, le téléchargement prend un certain temps.)

Fichiers de parole

Télécharger

Bande passante audio 3,5 kHz, POTS de qualité

  speech_3p5kHz_mulaw.wav (114 Ko)

Bande passante audio 7 kHz, codée à 16 kbit/s avec Siren

 speech_16kbps_siren.wav (452 Ko)

Bande passante audio 7 kHz, codée à 24 kbit/s avec G.722.1

 speech_24kbps_g722p1.wav (452 Ko)

Bande passante audio 7 kHz, codée à 32 kbit/s avec G.722.1

 speech_32kbps_g722p1.wav (452 Ko)

Fichiers de musique

Télécharger

Bande passante audio 3,5 kHz, POTS de qualité

 music_3p5kHz_mulaw.wav (72 Ko)

Bande passante audio 7 kHz, codée à 16 kbit/s avec Siren

 music_16kbps_siren.wav (286 Ko)

Bande passante audio 7 kHz, codée à 24 kbit/s avec G.722.1

 music_24kbps_g722p1.wav (286 Ko)

Bande passante audio 7 kHz, codée à 32 kbit/s avec G.722.1

 music_32kbps_g722p1.wav (286 Ko)

Haut de page

Comparaison de Siren™ avec Windows Media Player et MP3

A savoir que Siren fonctionne parfaitement bien même en bas débit (par exemple, pour une connexion par modem commuté avec un débit compris entre 28,8 et 56 kbit/s). Ecoutez les échantillons de comparaison :

Bande passante audio 14 kHz Siren à 22 kbit/s par rapport à Windows Media Player (prend en charge uniquement une vitesse d'échantillonnage de 44 kHz à 22 kbit/s)*.

Débit

Télécharger

Télécharger

22 kbit/s

 siren_22kbps.wav

 wmplayer_22kbps.asf

*La bande passante de Windows Media Player dépend de ce qui est autorisé par le débit. Une vitesse d'échantillonnage de 44 kHz autorise uniquement une bande passante de 20 kHz.

Bande passante audio 14 kHz Siren à 24 kbit/s par rapport au MP3 (bande passante audio de 11 kHz maximum à 24 kbit/s)

Débit

Télécharger

Télécharger

24 kbit/s

 siren_24kbps.wav

 mp3_24kbps.asf

Haut de page

Echange de compatibilités pour les systèmes H.320, H.323 et H.324

Pour que l'équipement de divers fournisseurs soit compatible avec l'algorithme G.722.1, il est nécessaire de normaliser l'échange de compatibilité et la sélection de mode de l'algorithme G.722.1. Ces considérations techniques pour les systèmes H.320, H.323, and H.324 ont été définies par le groupe d'étude 16 de l'ITU-T.

Les détenteurs de licences recevront toutes les instructions nécessaires pour négocier l'utilisation de G.722.1 conformément aux normes de l'ITU-T, ainsi que les procédures de négociation et d'échange de compatibilités en vue d'une prise en charge par les fournisseurs de l'extension 16 kbit/s de Polycom de la norme.

Haut de page

Qu'est-ce que l'ITU ?

L'ITU est l'Union internationale des télécommunications (International Telecommunications Union) et a son siège à Genève en Suisse. Fondé en 1865, c'est l'organisme de traités internationaux le plus ancien au monde. Désormais rattaché aux Nations Unies, il est chargé de la normalisation de la technologie dans le domaine des télécommunications internationales, incluant le téléphone, la radio et les communications de données. Pour plus d'informations, rendez-vous sur le site Internet de l'ITU à l'adresse : http://www.itu.int.

Haut de page

Contact technique

Pour plus d'informations techniques, contactez-nous à l'adresse : SirenInfo@polycom.com

Programme d'enregistrement et de paiement de licence

Le programme de licence et un modèle d'accord de licence sont disponibles à la section : Calendrier de paiement de licence et Conditions de licence

www.polycom.fr fournit de nombreuses informations sur nos solutions audio, vidéo et de téléprésence pour nos clients en France.

Tour Franklin, 24e étage 100/101 Terrasse Boieldieu, La Défense 8 92042 Paris La Défense Cedex. Bureaux en Belgique et en Suisse.

Tél: +33 (0) 1 41 32 19 99 - contact@polycom.com

© Polycom, Inc. Tous droits réservés.