網誌文章分布

最新消息:
AviSynth/VapourSynth Filter 支援 YUV444P16 格式啦~ 這樣就有很多花樣可以玩了,像是Waifu2X, RIFE等RGB濾鏡可以幾乎無損輸出! 超開心
最近的腳本有提供RIFE實時撥放支援,等過段時間再把RIFE的相關資訊寫到Blog中 如果有時間的話...咕咕咕
DmitriRender迎來時隔年五年多的更新了(僅限NVIDIA Ampere, Turing, Pascal, Maxwell, Kepler顯示卡),同時也支援10Bit輸出。不過新版好像緩衝有點太少,容易卡頓
SVP最新版本已支援在DS系撥放器中透過Avisynth Filter輸出10Bit畫面,而且跳轉時卡頓狀況有大幅改善。
由AMD工程師回覆,AMD已徹底終止Fluid Motion技術,如有BFRC需求的用戶請多加留意。 (https://community.amd.com/thread/250830)

近期更新文章:
測試筆記:SVP最新測試版參數(beta script)(2023-12-17 腳本更新)
進階教程系列(十二) - 視訊解碼濾鏡 MPC Video Decoder(2022-06-11)
進階教程系列(三) - 字幕渲染濾鏡 XySubFilter丶AssFilterMod(2022-06-11更新)

2017年5月18日 星期四

進階教程系列(十) - 補幀所需頻寬試算

近來使用雙卡補幀的用戶越來越多,有部分用戶發現雙卡補幀在補4K影片時會有莫名卡頓的情況,
經過眾多網友實際測試下,發現此一現象應該是頻寬不足所導致的,
因此本篇就來計算看看,確認補幀需要多少頻寬吧。



首先我們先確認傳遞格式,
SVP採用YV12格式傳遞資訊,BlueskyFRC則是採用NV12格式,
兩種格式都是傳遞資訊8bit,因此計算方式應該相同。

而計算每秒傳輸量,我們可以分成兩類
1. 主機 → 顯示卡
     主機 → 顯示卡頻寬 = 影片水平解析度×影片垂直解析度×影片色深×影片幀率

2. 顯示卡 → 主機
     顯示卡 → 主機頻寬 = 影片水平解析度×影片垂直解析度×影片色深×補幀後幀率


以4K@30FPS影片補至60FPS來計算,
主機 → 顯示卡頻寬 = 4096×2304×8×30×(1+0.25+0.25) = 3240 Mbit/s = 405 MByte/s
顯示卡 → 主機頻寬 =  4096×2304×8×60×(1+0.25+0.25) = 6480 Mbit/s = 810 MByte/s

上式中的(1+0.25+0.25)是因為U丶V通道的水平丶垂直解析度僅有Y通道的一半


如果是硬解 + 單卡補幀Copy-Back模式,資料傳遞如下
主機 -(RAW)→ 顯示卡(解碼) -(4K@30FPS)→ 主機
-(4K@30FPS)→ 顯示卡(補幀) -(4K@60FPS)→ 主機
-(4K@60FPS)→ 顯示卡(渲染) -(4K@60FPS@RGB)→ 螢幕

因此,
主機 → 顯示卡:RAW + 405 MByte/s + 810 MByte/s = RAW + 1215 MByte/s
顯示卡 → 主機:405 MByte/s + 810 MByte/s = 1215 MByte/s
加上一些額外開銷*,至少需要PCI-E 2.0 x4 / PCI-E 3.0 x2才能順利撥放。


若是使用SVP補至瘋狂的240FPS,那頻寬需求就會非常誇張,超過3240MByte/s,
至少需要PCI-E 2.0 x16 / PCI-E 3.0 x8。


PCI-E理論半工頻寬 / 全工頻寬
PCI-E 2.0 x1 :500 / 1000 MB/s
PCI-E 2.0 x4 :2000 / 4000 MB/s
PCI-E 2.0 x8 :4000 / 8000 MB/s

PCI-E 3.0 x1:984.6 / 1969 MB/s
PCI-E 3.0 x4:3938 / 7876 MB/s
PCI-E 3.0 x8:7876 / 15752 MB/s

但由於傳遞過程中會產生額外開銷,所以有效頻寬會比理論值還低一些,
導致理論有效頻寬約86~98%理論頻寬,再加上部分系統參數的影響,
實際上雙向傳輸時可能只有63~73%理論頻寬。


於PCI-E 3.0 x8平台實際測試如果如下
測試所得 PCI-E 3.0 x8 (單向)傳輸效率約6165/7876 = 78.2%


*額外開銷參考資料:https://www.xilinx.com/support/documentation/white_papers/wp350.pdf

2018-10-13

2 則留言:

  1. 回覆
    1. 不會,有幾個原因
      1. 目前rife的速度還是太慢,無法實時撥放使用。
      2. rife雖然效果不錯,但是缺乏實用的遮罩來遮蔽偽影,導致算錯的地方相對明顯,我覺得需要一些預處理才會有較佳表現。

      刪除

熱門文章