La technologie Zipstream d’Axis

Depuis toujours Axis Communications s’est montré à la pointe de la recherche et développement en matière de vidéo sur IP. En 2015, elle a introduit dans certaines caméras une technologie appelée Zipstream. Cette technologie promet des réductions impressionnantes de bande passante : de 25 à 90 % d’un flux H.264 normal !

Comment fonctionne-t-elle ? Quelles sont ses conditions de mise en place pour un fonctionnement optimal ?

Rappelons le principe du codec H.264 : le flux est composé d’une image JPEG compressée, appelée I. C’est une image de référence. Puis, une succession d’image P, images « interpolées », qui sont calculées les unes par rapport aux autres. Elles ne véhiculent que les différences par rapport à l’image précédente. Leur poids est négligeable. Le nombre d’image P entre deux images I consitue le GOV (Group of Vidéo), encore appelé GOP (Group of P-Frames). On pourrait être tenté d’agrandir indéfiniment la taille du GOP pour réduire le coût de la bande passante. Hélas, il suffit de la perte d’un paquet d’information, pour perdre toutes les informations d’image, jusqu’à l’image I suivante. La taille moyenne d’un GOP est de 32 images.

La fréquence (mesurée en FPS – Frame per Second) est simplement le nombre d’images par secondes. Une fréquence trop basse risquerait de produire une vidéo saccadée. C’est pour répondre à ces contraintes, tout en réduisant effectivement la bande passante, qu’Axis a mis au point le Zipstream.

Le Zipstream – à ne pas confondre avec le nouveau codec H.265 (MPEG4 / HEVC), s’appuie sur trois principes : le dynamic ROI (région of interest), le dynamic GOP et le dynamic FPS. Le dynamic ROI détecte les zones intéressantes, les objets en déplacement, garde la qualité maximum sur ces zones tout en en compressant davantage sur le reste de l’image. Le ROI peut également modifier la mise au point, le lissage, tous les détails de l’arrière plan sur lesquels on peut économiser de l’information.

Le dynamic GOP modifie « à la volée » le nombre d’images clés véhiculé par le flux vidéos. Si rien ne se passe, pourquoi envoyer des images clés ? Le principe est de garder l’ancienne image I le plus longtemps possible. Dans la même approche, le dynamic FPS modifie la fréquence elle-même.  Le schéma ci-contre présente ce fonctionnement selon divers scénarios. Attention, car tous les VMS ne pourront peut-être pas relire correctement un flux vidéo à fréquence variable.

Notre équipe a testé les performances du Zipstream avec ses neuf réglages possibles : Bas, Moyen, Elevé, avec le dynamic GOP et le dynamic FPS activés ou non. On observe que les meilleurs résultats s’obtiennent, en milieu intérieur avec un réglage « zipstream » élevé, avec un GOP dynamique mais une fréquence régulière. Sur sa documentation, le constructeur indique qu’à chaque situation correspond un réglage spécifique. Ainsi, une scène extérieure, avec un champ très large (peu de détails) et bien éclairé (peu de bruit), le gain de bande passante atteint 85 %.

Une technologie à privilégier donc, en attendant la diffusion massive du H.265.