En 1895, lorsque Louis Lumière filme « l’Arrivée d’un train en gare de la Ciotat« , il est loin de se douter que 125 ans après, son film ferait encore parler de lui !
Et pourtant, ce célèbre court métrage fait encore l’actualité grâce au travail réalisé par le développeur Denis SHIRYAEV qui a utilisé « plusieurs réseaux neuronaux » pour le moderniser et lui donner l’aspect d’une vidéo qui aurait été tournée avec un smartphone.
Ce court métrage documentaire de 50 secondes est notamment célèbre pour avoir prétendument provoqué la panique des spectateurs de l’époque, par crainte que le train n’éclate à l’écran et ne leur rentre dedans. Bien que ce récit soit largement considéré comme une légende, il est facile d’imaginer l’impact qu’un tel visuel aurait eu sur quelqu’un qui n’avait jamais vu de film auparavant. Mais les historiens sont désormais d’accord pour dire que ce ne sont que balivernes et que nos ancêtres n’étaient pas aussi naïfs que ça !
Toujours est-il que Shiryaev s’est lancé le défi de moderniser ce grand classique en utilisant l’intelligence artificielle pour améliorer la résolution du film en 4K à 60 images par seconde. Et le résultat est tout bonnement impressionnant. Ce film d’un autre âge aux images grossières prend d’un coup une tout autre dimension. C’est comme si la scène avait été filmée hier. En noir et blanc, certes, mais la qualité de l’image la rend beaucoup plus concrète, beaucoup plus vivante !
La vidéo a également été sonorisée ce qui contribue à renforcer ce sentiment !
Shiryave ne donne pas beaucoup d’informations sur son travail, mais il semblerait qu’il a utilisé deux programmes disponibles au public, DAIN et l’IA Gigapixel de Topaz Labs, pour transformer la séquence originale en un clip 4K 60FPS.
L’IA Gigapixel utilise un algorithme d’interpolation propriétaire qui « analyse l’image, reconnaît les détails et les structures et complète l’image » selon le site web de Topaz Labs. En gros, Topaz a appris à une IA à rendre les images plus nettes et plus claires, même après qu’elles aient été agrandies de 600 %. DAIN, en revanche, imagine et insère des images entre les images clés d’un clip vidéo existant. C’est le même concept que la fonction de lissage de mouvement des téléviseurs 4K.
Bien sûr, le rendu de l’image n’est pas parfait, mais la technique utilisée par le développeur est vraiment intéressante et pourrait permettre de remettre au goût du jour les grands classiques du cinéma muet !
Enfin, un Youtubeur s’est même amusé à coloriser cette version 4K, mais le résultat est moins impressionnant à mon sens…
Article mis à jour le 24 janvier 2021 par Byothe