伴隨著影像分辨率的提高,4K、6K、8K成為了今天制作和放映的常態。與此同時,那些老的影片,想要匹配到新的放映分辨率標準,也變得更加困難。
但還好,AI技術的發展,讓一切變得皆有可能。VideoGorillas研究人員使用人工智能技術,將大量的老片子重制到了4K分辨率。
一種名為Bigfoot super resolution的新型生產輔助AI技術,通過使用神經網絡計算出低分辨率影片中缺失的像素,成功將電影從480p轉換成了4K。
經典的影片,重置成高分辨后重新上映,這樣的技術能夠讓觀眾在一個全新的視覺體驗中,重溫舊時的感動。
在傳統的影片重置流程中,大量的工作都需要人力完成,這即花錢又費時。VideoGorillas公司開發的人工智能增強解決方案,能夠用更低的成本實現超出預期的分辨率視覺感受。
一種新的解決方案: Bigfoot Frame Compare
總部位于洛杉磯的 VideoGorillas,是一家結合了機器學習、神經網絡、視覺分析、對象識別和實時流媒體技術的先進媒體技術開發商,這家公司與與好萊塢各大電影制片廠合作緊密。
VideoGorillas在2018年9月宣布,其研發的Bigfoot Frame Compare系統,將重新定義電影、電視和后期制作公司管理資產、整理、重新布置和保存項目的方式。
Bigfoot通過在一系列圖像中找到類似“興趣點”的共同點,來自動執行手工勞動密集型的處理(將原始膠片幀與最終編輯的作品相匹配)和比較處理(將不同膠片剪切之間的獨特或共同幀進行比較)。
2018年11月,VideoGorillas宣布Netflix公司將于2018年11月2日在影院和網上發布電影《風的另一面》,這是由著名導演奧遜·威爾斯執導的最后一部未完成的電影。
這部影片,使用了VideoGorillas公司的人工智能(AI)驅動的Bigfoot Frame Compare 框架對比技術。
每秒分析1200萬幀
《風的另一面》對電影制作人和 VideoGorillas來說都是了一個挑戰,因為它是一項混合了電影修復和全新介質發行的工作。這部擁有40年歷史的影片,有100多個小時的素材。
制片人Filip Jan Rymsza說:“在完成《風的另一面》的時候,我們面臨著一個非常重大的挑戰。”
“我們收集了不同來源的3.5小時的參考剪輯,我們必須把它與100小時的膠片掃描相匹配,包括16毫米、35毫米的底片和35毫米的正片。
傳統工作流程,助理剪輯需要對應參考完成剪輯,但有些畫面會從16mm放大到35mm,或者放大并重新定位,或者折邊,或者從彩色底片上用黑白打印出來,這使得人的肉眼很難做好匹配。
如果沒有VideoGorilla的人工智能技術完成這些精確的匹配,我們的剪輯團隊可能需要幾個月的時間才能完成,而VideoGorilla在兩周內完成了這項艱巨的任務。
通過掃描《風的另一面》的膠片片段,我們得到了900多萬幀。由于Bigfoot 最初是基于cpu的軟件,VideoGorillas又開發了一個實驗性的gpu版本,這讓洛杉磯辦公室的一臺機器,能夠完成通常需要200-300臺服務器的工作。
在攝取了視頻兩天之后,GPU只花了三天時間來分析這段視頻,在峰值加載時, Bigfoot每秒要分析1200萬幀。
Bigfoot super resolution(分辨率提升系統)
現在,VideoGorillas有了另一項技術,它融合了基于NVIDIA CUDA-X和Studio Stack的人工智能技術。通過集成gpu加速的深度學習和計算機視覺,允許制作公司在重置影片時,獲得更高的視覺保真度。
這種技術通過使用神經網絡來預測缺失的像素,從而將電影從480p轉換為4K,這些像素質量高得令人難以置信,讓原始內容幾乎與4K電影一樣出現。
“Bigfoot Super Resolution采用英偉達RTX技術,專注于解決提供目前傳統方法,無法實現的視頻質量和操作效率提升。
“我們非常高興能將這個解決方案推向市場,并希望幫助我們的電影和電視合作伙伴,在他們的內容庫中,找到重換生機的影片”。
如何在重置影片的同時,保留藝術創作意圖?
有趣的是,AI在影片重置工作中,除了提高生成效率和減少時間成本以外,居然還能夠發揮出創造性的作用。
VideoGorillas的研究團隊為每個項目訓練了一個獨特的遞歸神經網絡(RNN),由NVIDIA gpu加速。機器會學習同一時代、同一類型、同一制作方法創作的作品的特點。然后保持了那個時代/流派的外觀和感覺,從而保留了藝術意圖。
“我們正在為基于人工智能技術的,電影和電視影像,創造一個新的視覺感受。我們訓練AI去除各種干擾視覺的畫面元素,同時了解正在重置影片的時代、流派和媒介。利用這些AI技術,我們可以提高影片質量,保持影片的原汁原味的視覺外觀和感受。
generative adversarial networ(GAN)系統用于去除低分辨率區域中不需要的噪聲和偽影,同時用新的圖像合成和升級來替代它們。
這些AI都是使用Pytorch在CUDA和cuDNN中訓練,由于每部影片有數百萬張圖像,處理量非常大,所以VideoGorilla集成了DALI (NVIDIA Data Loading Library))來加快訓練時間。
Nvidia RTX驅動的人工智能技術
想要實現這種由AI完成的視覺新水平,只能通過NVIDIA RTX。該RTX的混合精度和分布式工作流的性能比CPU提高了200倍。VideoGorillas用RTX2080和Nvidia Quadro為更大規模的項目培訓超分辨率AI。
Nvidia框架能夠使 VideoGorilla將super-re超分辨率應用于HDR,高比特深度視頻,以及高達8K分辨率,并實現更快的光流性能。
純粹使用CPU來計算,4K和8K視頻的超分辨率真的不可行,速度太慢了。VideoGorillas首席技術官亞歷克斯·朱可夫說:“Nvidia GPU確實是實現高分辨率、高圖像質量的唯一選擇。”
在Prem解決方案中,他們還可以使用Nvidia Kubernetes將工作負載擴展到云端,在本地數據中心以及Amazon Web服務和Google云平臺中運行。從而實現更加強大的運算能力。
AI技術看似遙遠,實際上已經在影視行業,已經得到了越來越多的應用。
就拿所謂的AI分辨率增強來說,類似的技術在很多后期軟件中,也得到了應用,比如達芬奇16神經網絡引擎實現的Super Scale素材分辨率上變換,也實現的類似的效果。
所以,伴隨著這些科技公司,對于AI在影視領域的應用探索,在以前看來很多不可能實現的事情,現在都變得明朗起來。
與此同時,技術的進步也在為藝術的創作,帶來許多的新的可能性。
內容由作者原創,轉載請注明來源,附以原文鏈接
http://www.jgug.cn/news/4661.html全部評論
分享到微信朋友圈
表情
添加圖片
發表評論