Présentation VoIP    Enregistrer au format PDF

La voix sur réseau IP, parfois appelée téléphonie IP (ToIP) ou téléphonie sur Internet et souvent abrégée en « VoIP » (Voice over IP), est une technique qui permet de communiquer par la voix via Internet ou tout autre réseau acceptant le protocole TCP/IP


par Sphix

 Description de fonctionnement

Schématiquement, le transport de la voix se fait ainsi. Le codec audio de l’émetteur numérise et compresse la voix, ces données numériques sont acheminées jusqu’au destinataire dans des paquets IP. Le codec du destinataire effectue les opérations inverses (décompression, puis restitution du son).

Pour assurer une certaine qualité à la voix, il y a plusieurs facteurs à considérer. Par convention, l’information voyage dans des datagrammes UDP (on ne parle en effet de paquet qu’après encapsulation IP), un protocole qui ne garantit pas la livraison, en échange de moins de traitement tout au long de son voyage sur le réseau. Selon les conditions du réseau, engorgement surtout, certains datagrammes UDP sont détruits. Le protocole UDP n’effectuant aucune vérification concernant la perte de paquets, les informations liées à ces datagrammes sont perdues puisqu’ils ne sont pas retransmis.

La numérisation est un processus discret, c’est-à-dire que plusieurs fréquences contenues dans la voix ne sont pas numérisées ni restituées, ce qui amène une perte d’information. Il est possible d’augmenter la qualité de la voix, mais au prix de demander plus de bande passante. Pour la voix, sans compression, la bande passante est de 64 kbps (codec G711), il existe de nombreux autres codecs dont le G729 moins consommateur et dernièrement des normalisations autour de codecs larges bandes comme G729-EV, permettant d’améliorer sensiblement la qualité vocale des communications.

Pour des raisons techniques, le phénomène d’écho est, à degré variable, omniprésent dans ce type de communication. Les logiciels qui compensent cet effet sont souvent propriétaires. Supposons que l’appareil A utilise le logiciel A et que l’appareil B utilise le logiciel B. Les deux logiciels risquent de traiter l’écho de façon légèrement différente, ce qui amène des effets de bord non contrôlés. Par exemple, des sifflements se font entendre pendant la communication. Finalement, la latence variable du réseau Internet fait que les données voyagent plus ou moins vite. Alors que cette variabilité est acceptable pour des données, elle ne l’est pas pour la voix, phénomène physique qui demande une certaine continuité pour que les gens puissent se comprendre.

La transmission des fax et les services d’urgence (18, 17, 911,…) sont aussi des défis importants à résoudre pour la téléphonie IP dite grand public. En effet, l’utilisation d’adresse IP est relativement indépendante de la localisation de l’utilisateur (contrairement à l’utilisation d’une ligne de cuivre traditionnelle qui identifie formellement la localisation de l’usager), ce qui complexifie le routage des appels vers le service d’urgence le plus proche.

En dehors de la VoIP sur Internet, la VoIP se retrouve aussi dans le milieu opérateur en cœur de réseau pour remplacer les infrastructures TDM traditionnelles. On trouve principalement 2 usages résidentiels opérateurs :

  • l’utilisation de call server IP et de passerelle VoIP résidentielles (Livebox, Freebox,ClubBox, Wenbox, Annabox,…) pour utiliser l’ADSL pour transporter la voix plutôt que la bande basse de la ligne analogique
  • l’utilisation de call server IP et passerelles voix dans les DSLAM qui permettent de faire de la voix sur IP à partir d’un téléphone traditionnel et de manière transparente pour l’utilisateur.

Ces évolutions d’usages amènent les grands opérateurs à revoir leurs infrastructures cœur pour le traitement d’appel. Les normalisations européennes ETSI normalisent pour ces usages TISPAN qui instancie et fédère les normalisations 3GPP IMS pour un usage convergent fixe mobile sur IP.

 Les principaux protocoles

Les principaux protocoles utilisés pour l’établissement de connexions en voix sur IP sont :

  • H.323
  • IAX (Asterisk)
  • SIP
  • MGCP
  • SCCP (propriétaire Cisco Systems)
  • Jingle, basé sur le protocole de messagerie instantanée standard ouvert Jabber

Les principaux protocoles utilisés pour le transport de la voix elle-même sont :

  • RTP
  • RTCP

 Les différents modes de diffusion

Le terme « VoIP » est en général utilisé pour décrire des communications « point à point ». Pour la diffusion de son sur IP en multipoints, on parlera plutôt de streaming, comme les radios Web par exemple.

La voix ou le son sur IP peut se faire en mode Unicast, Broadcast ou Multicast sur les réseaux, c’est-à-dire en mode « point à point », en mode « une émission et plusieurs réceptions » (comme un émetteur TV, par ex.) et en mode « une émission pour plusieurs réceptions » (mais le signal n’est routé que s’il y a des récepteurs). Le protocole H.323 ne fonctionne qu’en mode Unicast.

Note : Le transport de communication sur IP est très dépendant du délai de latence d’un réseau. Ce délai influe beaucoup sur la qualité psycho-acoustique d’une conversation. Avec l’avènement des réseaux 100 Mégabits/s et ADSL, les temps de latence deviennent acceptables pour une utilisation quotidienne de la voix sur IP. À l’inverse, les connexions par liaison satellite souffrent d’un temps de latence souvent trop important pour prendre en charge les applications de voix sur IP. En moyenne, le temps de latence sur ce type de liaison est estimé entre 400 et 800 millisecondes. Une connexion filaire (fibre optique ou cuivre) bénéficie d’un temps de latence de 60 à 200 millisecondes. Plus que la latence c’est la Gigue (jitter en Anglais) qui pénalise la voix sur IP. En effet s’il y a des fluctuations du signal en amplitude et fréquence il faudra un mécanisme de remise en ordre des paquets afin de restituer le message vocal, processus qui se traduira par des blancs, des attentes.

Documentations publiées dans cette rubrique