• Présentation de la technologie VoIP
    Introduction to VOIP header image
  • Introduction to VOIP
    Introduction to VOIP header image

Présentation de la technologie VoIP

L'acronyme VOIP signifie « Voice Over IP » (voix sur IP).

La plupart d'entre nous connaissons le système téléphonique commuté public (PSTN, Public Switched Telephone System), qui nous permet de contacter des personnes dans le monde entier en composant une série de chiffres. La VoIP constitue une alternative, qui fonctionne en acheminant les signaux vocaux numérisés sur des réseaux IP, tels que les réseaux Intranet d'entreprise ou, dans certains cas, l'Internet public.
 
À première vue, le système PSTN n'a pas vraiment changé en plus de 100 ans. Pourtant, de nombreuses modifications et améliorations technologiques y ont été apportées, telles que la tonalité de composition et l'identification de l'appelant. Néanmoins, pour l'utilisateur, il s'agit toujours de composer (plus récemment, par pression) une série de chiffres et d'être connecté à la personne à laquelle appartient le numéro composé. Toutefois, pour atteindre ce résultat, ce qui se passe en coulisses a considérablement changé au cours des dernières années.
 
La VoIP n'est pas réellement une nouvelle technologie ; des documents et brevets portant sur le sujet sont datés de plusieurs décennies et les premiers logiciels de VoIP étaient déjà disponibles en 1991. Le principe de base est assez simple : il s'agit essentiellement de la même technologie que celle utilisée pour diffuser de la musique sur Internet. Les sons de la voix sont récupérés par un microphone et numérisés par la carte son. Les sons numérisés sont alors compressés à l'aide d'un codec audio. Ce dernier supprime les données inutiles, tout en conservant la lisibilité des sons, afin de rendre le flux suffisamment compact pour qu'il soit envoyé en temps réel sur le réseau. Le terme codec est l'abréviation utilisée pour « CODeur/DÉCodeur ». Les sons sont encodés à la fin de l'envoi, envoyés sur le réseau, puis décodés à la réception, où ils sont rejoués dans les haut-parleurs ou le casque d'écoute. 
 
 
 
Les seuls outils nécessaires sont une connexion réseau entre les deux ordinateurs à une vitesse adéquate et des codecs correspondants à chaque extrémité.
 
Les ordinateurs ordinaires « prêts à l'emploi », équipés de microphones, de cartes son, de casques d'écoute et d'une connexion haut débit, sont parfaitement adaptés.
 
 
Il est bien entendu nécessaire que les deux parties qui conversent utilisent le même codec avant de passer un appel ; ainsi, les résultats de la compression dans les flux audio peuvent être décompressés correctement par le système à l'autre bout. Comme le sait toute personne possédant un lecteur de musique, les codecs changent tout le temps. mp3, wma, ogg, mp4 et aac sont des extensions de fichiers que vous avez pu observer sur des fichiers de musique compressés, tirés de boutiques de musique en ligne ; ils sont tous différents. Certains lecteurs de musique les prennent tous en charge, d'autres en reconnaissent seulement quelques-uns, d'autres encore reconnaissent uniquement un type précis. 
 
Il existe heureusement des éléments communs dans le monde de la téléphonie ; les systèmes VoIP peuvent en général négocier pour trouver un codec compréhensible par les deux parties. Parmi les codecs téléphoniques couramment utilisés, on peut citer G.711, G.729 et G.726, bien qu'il en existe de nombreux autres, y compris des systèmes exclusifs. Il existe deux grandes différences entre ces codecs. Premièrement, la puissance du processeur requis pour réaliser la compression et la décompression, qui a une incidence sur le type de matériel nécessaire dans le système (ordinateur, standard ou téléphone), et deuxièmement, la taille du flux audio ou du fichier compressé, et donc, la quantité de bande passante sur le réseau nécessaire pour transporter les données entre les deux parties. Cela a un impact sur l'infrastructure du réseau. 
 
Pour être utile, un système VoIP a besoin d'une méthode pour établir et gérer une connexion, par exemple : pour appeler l'autre ordinateur, déterminer s'il accepte l'appel et fermer la connexion une fois qu'un utilisateur a raccroché. Les systèmes VoIP permettent d'établir des communications bidirectionnelles et même des téléconférences ; cette partie est donc plus complexe qu'une simple diffusion audio en continu. C'est au niveau de la gestion des appels (ouverture de session, établissement et libération des appels) que les systèmes VoIP diffèrent profondément, ce qui implique que deux utilisateurs VoIP doivent utiliser le même système (ou des systèmes compatibles) afin de pouvoir s'appeler.
 
Étant donné que la plupart des internautes particuliers ne disposent pas d'une adresse Internet permanente, les systèmes VoIP pour particuliers ne fonctionnent généralement pas en appelant directement un autre ordinateur ; c'est comme si leur numéro de téléphone changeait régulièrement. Chaque utilisateur du service est en fait enregistré auprès d'un serveur intermédiaire, qui garde en mémoire son adresse IP pendant toute la durée de la connexion. Une petite application peut être installée sur le PC de chaque utilisateur pour gérer ces données conjointement avec le serveur.
 
L'autre utilité du serveur intermédiaire est qu'il facilite le fonctionnement des systèmes VoIP avec les pare-feu. De nombreux pare-feux bloquent les données Internet non envoyées en réponse à une requête spécifique. Il est alors impossible d'appeler directement un autre ordinateur car ce dernier n'a demandé aucune donnée à l'appelant ; la requête d'appel est donc bloquée. 
 
En établissant une connexion avec un serveur, le logiciel VoIP ouvre un canal de communication par lequel les autres ordinateurs peuvent lancer l'appel. La communication peut se poursuivre par le biais du serveur, ou les informations peuvent circuler via le serveur permettant aux deux ordinateurs d'ouvrir une connexion directe entre eux et l'opération peut continuer via ce canal de communication.
 
 
Normes
Plusieurs normes sont utilisées dans le cadre des communications VoIP (voix sur IP). Celles-ci se divisent en deux catégories : les « normes ouvertes » qui peuvent être utilisées par tout un chacun et les systèmes propriétaires. H.323 et SIP font partie de la première catégorie, tandis que Skype utilise son propre système propriétaire.
 
H.323 est une norme de téléconférence développée par l'ITU (International Telecommunications Union, Union internationale des télécommunications). Elle prend en charge la transmission multimédia de la voix, de la vidéo et des données entre des groupes de deux participants ou plus et est conçue pour pouvoir être utilisée sur des réseaux de grande envergure. La norme H.323 ne dépend pas du réseau : elle est compatible avec les réseaux utilisant des protocoles de transport autres que TCP/IP. La norme H.323 constitue encore un protocole très important, mais elle n'est plus utilisée pour les produits VoIP grand public, car il est difficile de la faire fonctionner via des pare-feux conçus pour protéger les ordinateurs exécutant de nombreuses applications différentes. Il s'agit, de ce fait, d'un système mieux adapté aux grandes entreprises qui possèdent les compétences techniques pour contourner ces problèmes.
 
Le protocole SIP (Session Initiation Protocol) est un protocole de signalisation normalisé de l'IETF (Internet Engineering Task Force) utilisé pour la téléconférence, la téléphonie, la présence, la notification d'événements ainsi que la messagerie instantanée. Il fournit des mécanismes permettant de configurer et de gérer les connexions, mais pas de transporter les données audio ou vidéo. Il s'agit probablement du protocole le plus couramment utilisé pour la gestion de la téléphonie via Internet. Comme tous les protocoles de l'IETF, SIP est défini au moyen d'un certain nombre de RFC (Request For Comments, demande de commentaires), notamment RFC 3261.
 
Une implémentation VoIP basée sur SIP peut transmettre les données vocales codées sur le réseau de plusieurs manières. La plupart des implémentations utilisent le protocole RTP (Real-time Transport Protocol), défini par la RFC 3550. SIP et RTP sont tous deux implémentés sur UDP, qui, en tant que protocole sans connexion, peut engendrer des problèmes avec certains types de routeur et de pare-feu. Pour être utilisables, les téléphones SIP doivent donc également faire appel à STUN (Simple Traversal of UDP over NAT), un protocole défini par la RFC 3489 permettant à un client situé derrière un routeur NAT d'identifier son adresse IP externe et le type de périphérique NAT. En théorie, le protocole STUN vise à simplifier la configuration d'un logiciel ou d'un équipement VoIP basé sur le protocole SIP derrière le pare-feu d'un particulier ou d'une petite entreprise. Cependant, dans la pratique, des problèmes peuvent encore survenir.