第四十四章 超级视频压缩-《月之影面》
第(2/3)页
要是哥德尔系统给王一男来这么一手,那可就要哭了,不过真那样,我估计王一男也顾不上哭,赶紧把哥德尔系统砸了才对,这种成精的人工智能,还是砸了放心啊。
王一男将压缩后150M大小的视频文件输入到反向神经网络中,这个视频文件的格式可是完全自定义的,而且估计每段视频都不一样,只有哥德尔系统或者等价的LLVM代码可以识别。
“这以后可就麻烦了,视频压缩完全没有格式和规范啊,神经网络选择最高效的方式,想怎么压缩就怎么压缩,反正只要自己认得就行了,说不定只有传说中四维空间模型,才能解释神经网络内部的压缩机制”。
王一男正有一搭没一搭的想着呢,“哔哔”的蜂鸣声又响了起来,看了看时间,解压缩的时间还不到十秒,这也是正常的,任何压缩算法理论上都会比解压缩算法耗费时间。
不过这个时间的比例也超乎王一男的意料,因为按照H264或者H265的经验来看,压缩所需要的计算能力至少是解压缩的十倍以上,也就是说,在同样的硬件下,如果是和H264、H265类似的算法,解压缩的时间应该在两秒左右。
“看来哥德尔系统的压缩算法跟现有体系完全不同,不过,在这个领域跟围棋一样,机器也已经远远超过人了,至少,人设想的最好算法比神经网络差了五倍以上”,
“只不过,人类永远也无法理解哥德尔系统的算法啊”,王一男感慨了一番,
“理解不了没关系,能复制就行了,我真的是个天才,居然想到功能复制这一招,就是不知道米歌的狗狗让不让人去复制一把”。
高兴归高兴,王一男还是没忘记最后一步,他让哥德尔系统按照每秒三十帧的速度在屏幕上回放解压缩出来的图像序列,王一男抽几段看了一会,至少肉眼看不出来跟原始的片源有什么差别。
不过光主观感受没用,还是需要数据说话,王一男运行了一个开源的PSNR评价程序,也就是对原始图像和压缩/解压缩之后的图像,比较峰值信噪比,但是让王一男意外的事情发生了,
峰值信噪比的差异非常大,也就说是,评价程序认为前后两幅图像的差异非常大,甚至比H265 降低一倍码率之后压缩成H264的差异还要大。
但是这和王一男的主观感受是完全相反的,王一男也看过降低一半码率的H264视频,那整个画面的质量下降非常明显,什么模糊、毛刺都出现了,但是现在的视频流,王一男感觉不到图像有任何生硬的地方。
问题出在哪里呢,应该说,王一男对自己的眼力还是有很强信心的,要知道,当年看波多女士的片子,王一男可是连码率500K还是码率550K压制都能分的出来。
看起来,问题只可能出在PSNR算法了,因为图像主观上如果有一些结构的小变化,或者整体的位移等等,是不会影响视频的整体主观感觉的,但是PSNR看起来,误差就非常大了。
王一男立刻查阅了相关文献,果然,网上对PSNR算法的吐槽声一片,在开源的机器视觉网站,王一男找到了最新的复小波结构相似性指标算法,从多方文献来看,这应该是和主观性评测符合的最好的机器视觉检测指标了。
第(2/3)页