Différents types de caméra peuvent être employées pour rencontrer des besoins particuliers d’un projet en téléprésence. Le tableau suivant résume certains des avantages et désavantages pour chaque type de caméra les plus fréquemment utilisées :
Types de caméra | Avantages | Désavantages |
---|---|---|
Caméra vidéo professionnelle (ex : CANON) | Objectif adaptable; Contrôle manuel et intégral des paramètres; Contrôle à distance possible; Option de configuration rapide; Sortie vidéo SDI. |
Taille plus imposants (peu discret sur scène); Sensible à la lumière moyenne |
Caméra d’action (ex : GoPro) | Objectif grand-angle et mode étroit (narrow) pour simuler un angle standard; Contrôle à distance possible via un téléphone intelligent; Léger et de petite taille, il est facile à dissimuler. |
Le mode grand-angle déforme les contours et le mode étroit réduit la résolution en pixel; Piètre performance à faible luminosité; Sortie vidéo mini HDMI seulement. |
Appareils mobiles (ex : iPhone) | Objectif standard utile pour capter les proportions à échelle humaine; Sorties vidéo sans fil via une connexion WiFi (NDI ou IP). |
Applications payantes et offrant peu de paramètres contrôlables; Absence de sortie vidéo physique autre que USB; Risque de conflit entre la caméra et d’autres applications; Nécessite un bon réseau WiFi. |
Caméra robotique (PTZ) | Conçue pour être contrôlée à distance; Contrôle avancé des paramètres; Plusieurs options de sorties vidéo physiques (DVI, HDMI, Ethernet). |
Taille parfois encombrante ou difficile à installer; Absence de contrôle manuel; Appareil dispendieux. |
Webcam | Facile à utiliser : peu ou pas de configuration nécessaire. | Limité à une connexion USB sur un ordinateur; Peu mobile; Peu paramétrable; Qualité de l’image parfois discutable Distance (zoom) souvent fixe; Souvent réservée à une seul application à la fois. |
Si la caméra occupe un trop grand espace, elle risque d’être visuellement peu discrète, voire d’obstruer la vue du public local, ou encore, d’être difficile à positionner selon la zone de captation souhaitée.
Par exemple, l’emploi d’une petite caméra d’action permet de positionner celle-ci plus discrètement devant une surface de projection, afin qu’elle se situe à la hauteur du visage pour maximiser le jeu de regards entre les agents. Par le fait même, la taille du support fixant la caméra en place sera d’autant réduite.
Cette considération influe donc sur le choix du type de caméra à privilégier en fonction de sa taille : les petites caméras offrent une plus grande flexibilité en terme de positionnement; en contrepartie, leur qualité vidéo est généralement inférieure à celle des modèles professionnels, souvent plus volumineux.
Cet ensemble de facteurs est d’autant plus susceptible d’influencer le choix d’une caméra ou l’ajout d’accessoires complémentaires, comme un support particulier ou un certain type d’objectif.
Par exemple, si l’espace disponible ne permet pas de positionner la caméra à une distance permettant d’obtenir un champ de captation suffisamment large, l’emploi d’un objectif grand-angle pourrait être envisagé, bien que cela puisse être au prix d’une distorsion de l’image.
Dans un autre cas, on pourrait souhaiter une prise de vue verticale plutôt qu’à l’horizontale, afin d’afficher une personne en taille réelle. Afin de conserver une résolution optimale, on pourrait alors incliner la caméra à 90° sur le côté. Il faudrait donc prévoir un support permettant ce type d’inclinaison.
Enfin, on pourrait aussi souhaiter un champ de captation dynamique et à angle variable, soit à partir d’un point fixe, comme le permet une caméra robotique, ou carrément mobile connectée sur le réseau Wi-Fi, comme celle d’un téléphone intelligent.
Une fois que l’éclairage et les caméras sont bien en place, il est recommandé de calibrer l’équilibre des paramètres optiques de ces dernières. Ceci est d’autant plus important dans un contexte de téléprésence puisqu’il n’y a pas de post-production pour la vidéo en directe. Selon le niveau d’éclairage de la scène, l’exposition idéale dépend des paramètres suivants :
L’un des nombreux avantages d’une caméra robotique est la possibilité de contrôle à distance. Bien que les autres types de caméra n’offrent pas autant de dynamisme, quelques-unes permettent tout de même d’en contrôler certains paramètres à distance, soit par l’entremise d’une application mobile, d’une page web, ou encore, d’une télécommande. Durant les essais techniques, par exemple, l’ajustement de certains paramètres visuels (zoom, focus, luminosité, etc.) demeure aisé même si ladite caméra n’est pas directement accessible (loin de la régie vidéo, fixée en hauteur, etc.)
Les appareils portables disposent généralement d’une caméra vidéo capable de capter des images HD. Certaines applications permettent notamment de transmettre ces images sur un réseau local, via une connexion Wi-Fi (sans-fil). En employant une borne WiFi ou routeur connecté sur le même réseau que la régie télématique, il est possible d’y recevoir tout flux audiovisuel provenant d’un de ces appareils, qu’il s’agisse d’un flux NDI ou autre (HTTP). Afin d’obtenir un flux de qualité, il est toutefois important de bien considérer tout obstacle et la distance séparant la borne ou le routeur WiFi de l’appareil mobile en question. Si l’appareil mobile s’éloigne trop de sa source de connexion sans-fil au réseau local, la qualité du flux risque autrement de se dégrader, jusqu’à être interrompu.
De plus, il est recommandé de restreindre cet accès au réseau sans-fil pour qu’il soit seulement dédié aux appareils mobiles employés comme caméra pour l’événement. En effet, si trop d’appareils venaient à se connecter simultanément à la même borne ou routeur WiFi, cela risquerait de provoquer la saturation de la connexion et ainsi rendre la qualité de la transmission imprévisible.
L’un des facteurs les plus déterminant quant au choix du type de caméra à employer est certainement la qualité de l’image qu’elle produit. Toutefois, dans un contexte de téléprésence, où le signal vidéo doit nécessairement être transmis par internet vers une ou plusieurs destinations, la qualité visuelle du signal peut difficilement être conservé à sa valeur initiale – compression oblige. Qu’à cela ne tienne, il est tout de même important de minimiser autant que possible toute réduction de la qualité, et ce, à chaque étape de la transmission du signal, mais surtout à sa source.
D’autre part, si les fonctions d’enregistrement ne sont pas essentielles pour la téléprésence, la sensibilité de la caméra, soit sa performance à faible intensité lumineuse, est particulièrement importante afin de limiter le « bruit » dans l’image, surtout lorsqu’il n’y a peu ou pas de projecteurs ou d’éclairages disponibles. Dans un tel cas, les caméras de catégorie professionnelle offrent généralement une meilleure plage dynamique en matière de luminance – qui laisse davantage paraître les détails dans les zones d’ombres ou d’intense luminosité – et un meilleur rendu de chrominance, en plus d’offrir différentes options quant au choix d’objectif (standard, grand angle, très grand angle, macro, etc.)
À des fins de transmission internet, la résolution d’image est généralement maintenue à 1920x1080 pixels, ou encore, réduite à 1280x720 pixels afin d’économiser la bande passante de la connexion internet sortante (téléversement). Il est tout de même recommandé de maintenir le signal de la caméra à une résolution optimale, puis de la réduire, au besoin, en aval de la source vidéo – via un appareil ou un logiciel d’encodage vidéo, par exemple.
En général, deux types d’affichage vidéo sont employés : le système de projection, comprenant un projecteur et une surface de projection, et les écrans à vision directe (téléviseur, écran d’ordinateur, vitrine ou mur d’images LED, etc.) Alors que les projecteurs servent à afficher un flux vidéo sur de très grandes surfaces, tout en permettant d’en modifier le format, ils sont idéals pour représenter des sujets en taille réelle et pour les projections devant public. En contrepartie, la visibilité de leur projection est davantage affectée par la lumière ambiante qu’un écran à vision directe. Les écrans à vision directe, de par leurs dimensions plus ou moins restreintes, s’adaptent et se déplacent assez facilement au sein d’un espace. La visibilité de leur image est moins affectée par la lumière ambiante. Ils peuvent aussi servir d’affichage vidéo d’appoint pour les participants.
En général, les systèmes de projection demandent davantage de temps et de préparation afin d’être installés adéquatement. Voici quelques points à prendre en compte :
Afin d’optimiser la qualité sonore d’un événement, certaines considérations sont à prévoir. En l’occurrence, le phénomène d’écho est un problème fréquemment rencontré dans un contexte de téléprésence – où l’interaction vocale ou sonore entre deux lieux peut souvent jouer un rôle important.
Afin de limiter, voire éliminer complètement ce phénomène, il faut reconnaître la cause qui en est l’origine, soit la réinjection avec du retard d’un signal audio sortant vers un entrant, qui est à nouveau transmis vers la sortie et se répétant ainsi de suite. Dit autrement, le phénomène se résume à ceci : le son capté à un endroit est à la fois entendu localement et transmis vers un lieu distant où il est aussi émis par des haut-parleurs; ce signal est à nouveau capté par un microphone du lieu distant qui le renvoie vers son lieu d’origine; le signal est alors émis de nouveau par les haut-parleurs locaux, avec un retard de quelques centaines de millisecondes, d’où l’effet d’écho.
Voici donc les principaux facteurs à considérer dans la gestion du coulage audio :
Moins sensibles aux bruits environnants, les microphones plus directifs – c’est-à-dire qui présentent un patron polaire de type cardioïde, supercardioïde, hypercardioïde ou canon (shotgun) – permettent de pointer ledit microphone en direction des sources sonores (entrants) que l’on souhaite capter spécifiquement, réduisant par le fait même l’intensité de tout autre son environnant non-désiré.
Les microphones omnidirectionnels captent les sons provenant de toutes les directions et doivent être placés à une certaine distance de la source (12 à 20 cm), mais sont moins sensibles aux bruits indésirables de manipulation, au vent ou aux plosives («t», «p» et «b»);
Les microphones directionnels sont moins susceptibles de causer des larsens, mais sont davantage suceptibles aux plosives, à l’effet de proximité (exagération des basses), aux bruit de vent et de manipulation.
Le micro canon (supercardioïde) sert surtout à capter des sujets en position fixe – qui ne se déplacent pas --, comme lors d’une entrevue, sans quoi ces derniers risqueraient de constamment sortir du champs de captation dudit microphone.
D’autre part, certains types de microphones sont conçus pour des usages bien spécifiques. Par exemple, les microphones miniatures, tels qu’un micro-cravate ou serre-tête, sont généralement sans-fil, main-libre, très discrets et placés très près de la source vocale (bouche). Ils sont donc idéaux pour maintenir le gain du signal en entrée à un niveau suffisamment bas pour limiter le coulage provenant d’autres sources sonores environnantes.
Les microphones de type électrodynamique (ex. Shure SM58, Sennheiser E845, etc.) sont communément employés pour la scène grâce à leur robustesse, tant par la simplicité de leur constitution que leur capacité à supporter de très grandes dynamiques sonores sans dégradation. En contrepartie, leur sensibilité, et par conséquent leur fidélité audio, est assez limitée. C’est pourquoi ils servent essentiellement à la captation de la voix ou d’instruments en proximité, ce qui peut être un avantage dans la volonté de limiter la captation de sources sonores non désirées, comme les haut-parleurs de salle ou de scène.
Les microphones de type électrostatique (à condesateur) (ex. Neumann U87 ou TLM 103, Shure Beta 53, Sennheiser HSP, la plupart des lavaliers et shotgun, etc.) sont communément employés dans des environements contrôlés (studios d’enregistrement, plateaux de télévision ou tournage, etc.) grâce à leur plus grande sensibilité et fidélité audio. En contrepartie, ils sont plus fragiles et plus sensibles aux bruits indésirables que les micros dynamiques, en plus de nécessiter une alimentation électrique et une pré-amplication. En raison de leur plus grande sensibilité, ces micros ne sont pas recommandés dans un contexte à haut volume ou à proximité d’un système de son amplifié. De plus, plus une membrane est de petite taille (ex. lavaliers ou micro-casques) plus le micro requiert une amplification supérieure, afin de compenser sa sensibilité moindre aux légères variations d’amplitude, ce qui a pour effet d’augmenter sa sensibilité aux sons environnants ou aux effets larsens. Dans ce contexte, les micro-casques sont à prévilégier par rapport aux lavaliers, car ils peuvent être situés plus près de la source vocale (bouche) et donc permettre une amplification moindre, ce qui réduit d’autant le risque de coulage (echo) et de larsens, dans un emploi sur scène.
En plus d’employer un microphone directif, naturellement pointé en direction de la source que l’on souhaite capter, celui-ci devrait idéalement être situé le plus près possible de ladite source et proportionnellement le plus loin possible de toute autre source sonore que l’on ne souhaiterait pas capter.
En combinant la directivité du microphone et sa proximité par rapport à la source, il devient plus aisé de maintenir le gain d’entrée du microphone à un niveau relativement faible, réduisant d’autant sa sensibilité aux sons provenant de sources environnantes et plus éloignées.
Inversement, les haut-parleurs doivent être situés le plus loin possible des microphones dont le signal est ensuite transmis vers un lieu distant, dans la mesure où le signal sortant desdits haut-parleurs provient également de ce lieu. Dans le cas contraire, le signal provenant d’un lieu distant et émis par les haut-parleurs locaux sera susceptible d’être capté par un microphone, puis réacheminé vers les sorties haut-parleurs du lieu d’origine. Si le lieu distant a une configuration tout aussi problématique, le signal sera de nouveau capté, puis renvoyé vers l’autre et ainsi de suite.
Néanmoins, malgré le fait d’éloigner et d’orienter les enceintes émettrices de sons provenant d’un lieu distant en direction opposé aux microphones, il est fort probable que cela ne suffise pas à éliminer complètement le coulage audio si le niveau sonore des signaux sortant des enceintes est trop intense. C’est pourquoi il est recommandé d’établir un équilibre entre le niveau d’intensité sonore des sorties et celui du gain d’entrée des microphones, afin de créer un écart dynamique assez grand entre le niveau d’intensité des sons désirables – idéalement plus forts – et indésirables – idéalement plus faibles. Cet équilibre facilitera notamment l’ajustement du seuil d’une porte à bruit et, par le fait même, son efficacité.
Le principe de la porte à bruit se résume à atténuer (fermeture) partiellement ou complètement le niveau sonore d’un signal audio entrant lorsqu’il se situe sous un certain seuil (habituellement en dB) préétablie : si le niveau sonore se situe toutefois au dessus de ce seuil, le signal reste alors inchangé (ouverture) à la sortie. L’emploi d’une porte à bruit – qu’elle soit logicielle ou matérielle – sur les signaux entrants peut s’avérer très efficace pour éliminer l’effet d’écho dû au coulage, dans la mesure où les recommandations précédentes sont bien respectées. En effet, si l’écart dynamique entre les sons désirables et indésirables n’est pas suffisament grand, il sera très difficile d’ajuster le niveau du seuil de fermeture de ladite porte. Néanmoins, un tel outil est tout-à-fait essentiel à la bonne gestion audio dans un contexte de téléprésence. Si l’équipement utilisé pour un événement n’intègre pas un tel outil, il faut alors prévoir une façon d’en ajouter un, et ce, idéalement pour chacune des entrées microphones envoyés vers un lieu distant.
Parallèlement, il faut établir une bonne communication avec l’équipe technique distante, afin de s’assurer qu’aucun effet d’écho ne soit effectivement entendu à la destination et de pouvoir en aviser ce dernier si tel serait le cas localement.
Sur le plan strictement sonore, il est nettement préférable d’équiper chaque participant, intervenant ou artiste de moniteurs intra-auriculaires – soit une ou deux oreillettes – plutôt que d’employer des enceintes acoustiques réparties autour de la scène – surtout pour des musiciens dans le cas d’un concert. Une telle solution peut néanmoins s’avérer trop complexe ou coûteuse, selon les besoins et la quantité d’individus qu’il faut équiper. Cela permet tout de même de limiter les signaux sonores sortant des haut-parleurs principaux, souvent dirigés vers le public plutôt que les participants.
Grâce à l’oreillette, les participants pourraient bien entendre un interlocuteur distant tout en isolant le signal sortant de leur microphone (entrant), rendant par le fait même le travail de la porte à bruit plus efficace. Il n’en demeure pas moins que l’intensité sonore sortant des enceintes principales doit demeurer à un niveau raisonnable par rapport à la sensibilité des microphones.
Le fait de spatialiser les sources sonores pour qu’elles soient perçues comme provenant du même endroit que leur image est une stratégie permettant non seulement de faciliter l’intelligibilité d’un dialogue, mais qui s’inscrit plus largement dans une philosophie immersive de la téléprésence en optimisant la crédibilité de l’expérience.
En localisant les sources sonores comme provenant de leur projection visuelle correspondante – à l’aide d’une surface de projection perforée ou tissée (acoustiquement transparente) permettant d’y dissimuler un haut-parleur directement à l’arrière de celle-ci, par exemple – la sensation de présence peut alors être renforcée par le fait que l’image et le son d’une présence distante soient situés ensembles au sein de l’espace à l’instar d’une présence tangible.
Un exemple simple est que la voix d’un sujet se situant du côté droit de la scène soit diffusée par un haut-parleur situé à droite de ladite scène, tandis que la voix d’un sujet distant, dont l’image est projetée du côté gauche de la scène, soit diffusée par un haut-parleur également situé à gauche.
Plusieurs façons différentes de spatialiser les sources peuvent être réalisées, selon les moyens techniques et télématiques disponibles. Mais, dans tous les cas, le principe théorique demeure : simuler la présence d’un lieu ou de sujets distants de manière crédible.