视频压缩方法、装置、电子设备及计算机可读存储介质制造方法及图纸

发布时间：2024-12-25 17:04

视频压缩不丢失质量的方法 #生活技巧# #数码产品使用技巧# #视频剪辑基础#

本申请涉及视频压缩技术领域，尤其涉及视频压缩方法、装置、电子设备及计算机可读存储介质。所述方法包括：通过特征提取模型提取目标视频的特征；将所述特征进行数据编码，得到隐表示神经网络模型的网络模型参数；根据所述目标视频对所述网络模型参数进行迭代优化，直至达到预设要求为止；通过优化后的隐表示神经网络模型重建所述目标视频，得到所述目标视频的压缩结果。本申请所述方法使得重建的视频即压缩后视频保留的帧信息足够精细乃至精确，率失真性能得到改进，从而使压缩后视频的质量高，视频压缩效率高。

【技术实现步骤摘要】

本申请涉及视频压缩，尤其涉及视频压缩方法、装置、电子设备及计算机可读存储介质。

技术介绍

1、随着数字技术的发展，视频数据在日常生活中已无所不在，所以视频存储与视频传输的应用也很广泛，但在视频存储与视频传输时为了节省存储空间往往需要将视频数据进行压缩。

2、现有技术中的视频压缩技术，无论是传统的混合视频编码框架，还是基于深度学习的视频编码框架，其核心都在于去除视频中空间冗余和时序冗余。尽管这些方法精心设计了各种方式，以块到块的方式或者帧到帧的方式，来去除时序上的冗余信息。然而，这些现有方法的缺陷在于只能利用到相邻帧或者有限的帧信息来去除帧间冗余信息，使得保留的帧信息不够精细乃至失真从而影响压缩后视频的质量，因此视频压缩效果亟待提高。

技术实现思路

1、基于上述技术问题，本申请旨在提供视频压缩方法、装置、电子设备及计算机可读存储介质，以解决视频压缩效果不够精细的问题。

2、本申请第一方面提供了一种视频压缩方法，所述方法包括：

3、通过特征提取模型提取目标视频的特征；

4、将所述特征进行数据编码，得到隐表示神经网络模型的网络模型参数；根据所述目标视频对所述网络模型参数进行迭代优化，直至达到预设要求为止；

5、通过优化后的隐表示神经网络模型重建所述目标视频，得到所述目标视频的压缩结果。

6、在本申请的一些实施例中，所述特征提取模型包括第一特征提取模型和第二特征提取模型；通过特征提取模型提取目标视频的特征，包括：>

7、通过所述第一特征提取模型提取所述目标视频的空间特征和频域特征；

8、通过所述第二特征提取模型提取所述目标视频的时序特征；

9、将所述空间特征、所述频域特征和所述时序特征通过融合模型进行融合，得到目标视频的特征。

10、在本申请的一些实施例中，所述通过所述第一特征提取模型提取所述目标视频的所述空间特征，包括：

11、构建并训练第一特征提取模型；

12、将与所述目标视频对应的视频序列的原始帧输入训练好的第一特征提取模型，得到所述空间特征。

13、在本申请的一些实施例中，所述通过所述第一特征提取模型提取所述目标视频的所述频域特征，包括：

14、使用频域变换操作将所述原始帧变换到频域空间；

15、去除所述原始帧在频域空间的低频信息，得到所述原始帧在频域空间的高频信息；

16、结合所述高频信息及所述第一特征提取模型提取所述频域特征。

17、在本申请的一些实施例中，所述结合所述高频信息及所述第一特征提取模型提取所述频域特征，包括：

18、使用频域变换操作对应的逆变换操作将所述高频信息变换为与所述目标视频对应的视频序列的高频帧；

19、通过高频帧样本重新训练所述第一特征提取模型；

20、将所述高频帧输入重新训练好的第一特征提取模型，得到所述频域特征。

21、在本申请的一些实施例中，所述第二特征提取模型是具有注意力机制的特征提取模型；所述通过所述第二特征提取模型提取所述目标视频的所述时序特征，包括：

22、从所述原始帧中选取当前帧、当前帧的前一帧和当前帧的后一帧；

23、将所述当前帧、所述当前帧的前一帧和所述当前帧的后一帧依次输入所述具有注意力机制的特征提取模型，依次得到所述当前帧、所述当前帧的前一帧和所述当前帧的第一时序特征、第二时序特征和第三时序特征；

24、计算所述当前帧、所述当前帧的前一帧和所述当前帧的后一帧的注意力权重；

25、根据所述注意力权重对第一时序特征、第二时序特征和第三时序特征进行加权和操作，依次得到加权后的第一时序特征、加权后的第二时序特征和加权后的第三时序特征。

26、在本申请的一些实施例中，所述将所述空间特征、所述频域特征和所述时序特征通过融合模型进行融合，得到目标视频的特征，包括：

27、使用自注意力机制计算所述空间特征的权重，使用频域注意力机制计算所述频域特征的权重，以及使用时间注意力机制计算所述时序特征的权重；

28、通过三种注意力机制计算得到的权重与对应的三种特征相乘，得到每种特征的加权版特征；

29、将所述每种特征的加权版特征拼接，得到所述目标视频的特征。

30、在本申请的一些实施例中，所述根据所述目标视频对所述网络模型参数进行迭代优化，包括：

31、根据所述目标视频获取所述网络模型参数的损失函数；

32、根据所述损失函数对所述网络模型参数进行迭代优化。

33、在本申请的一些实施例中，在所述将所述特征编码为隐表示神经网络模型的网络模型参数之后，还包括：

34、对所述网络模型参数进行量化熵编码操作。

35、在本申请的一些实施例中，所述隐表示神经网络模型包括输入层、隐藏层和输出层，其中，所述隐藏层包括编码器，所述输出层包括解码器；所述通过优化后的隐表示神经网络模型重建所述目标视频，得到所述目标视频的压缩结果，包括：

36、将所述目标视频的特征输入所述输入层；

37、通过所述隐藏层将所述输入层发送的特征进行特征提取得到特征向量；

38、通过所述解码器将所述特征向量映射至压缩视频；

39、将所述压缩视频通过所述输出层输出，得到所述目标视频的压缩结果。

40、本申请的第二方面提供了一种视频压缩装置，所述装置包括：

41、提取模块，用于通过特征提取模型提取目标视频的特征；

42、编码模块，用于将所述特征进行数据编码，得到隐表示神经网络模型的网络模型参数；

43、优化模块，用于根据所述目标视频对所述网络模型参数进行迭代优化，直至达到预设要求为止；

44、压缩模块，用于通过优化后的隐表示神经网络模型重建所述目标视频，得到所述目标视频的压缩结果。

45、本申请第三方面提供了一种电子设备，包括存储器和处理器，存储器中存储有计算机可读指令，计算机可读指令被处理器执行时，使得处理器执行如本申请各实施例中所述的视频压缩方法。

46、本申请第四方面提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如本申请各实施例中所述的视频压缩方法。

47、本申请实施例中提供的技术方案，至少具有如下技术效果或优点：

48、本申请各实施例中的所述视频压缩方法通过特征提取模型提取目标视频的特征，将所述特征进行数据编码，得到隐表示神经网络模型的网络模型参数，根据所述目标视频对所述网络模型参数进行迭代优化，直至达到预设要求为止，通过优化后的隐表示神经网络模型重建所述目标视频，得到所述目标视频的压缩结果，如此，使得重建的视频即压缩后视频保留的帧信息足够精细乃至精确，率失真性能得到改进，从而使压缩后视频的质量高，视频压缩效率高。

本文档来自技高网...

【技术保护点】

1.一种视频压缩方法，其特征在于，所述方法包括：

2.根据权利要求1所述的视频压缩方法，其特征在于，所述特征提取模型包括第一特征提取模型和第二特征提取模型；通过特征提取模型提取目标视频的特征，包括：

3.根据权利要求2所述的视频压缩方法，其特征在于，所述通过所述第一特征提取模型提取所述目标视频的所述空间特征，包括：

4.根据权利要求3所述的视频压缩方法，其特征在于，所述通过所述第一特征提取模型提取所述目标视频的所述频域特征，包括：

5.根据权利要求4所述的视频压缩方法，其特征在于，所述结合所述高频信息及所述第一特征提取模型提取所述频域特征，包括：

6.根据权利要求3所述的视频压缩方法，其特征在于，所述第二特征提取模型是具有注意力机制的特征提取模型；所述通过所述第二特征提取模型提取所述目标视频的所述时序特征，包括：

7.根据权利要求2所述的视频压缩方法，其特征在于，所述将所述空间特征、所述频域特征和所述时序特征通过融合模型进行融合，得到目标视频的特征，包括：

8.根据权利要求1所述的视频压缩方法，其

9.根据权利要求1所述的视频压缩方法，其特征在于，在所述将所述特征编码为隐表示神经网络模型的网络模型参数之后，还包括：

10.根据权利要求1-9任意一项所述的视频压缩方法，其特征在于，所述隐表示神经网络模型包括输入层、隐藏层和输出层，其中，所述隐藏层包括编码器，所述输出层包括解码器；所述通过优化后的隐表示神经网络模型重建所述目标视频，得到所述目标视频的压缩结果，包括：

11.一种视频压缩装置，其特征在于，所述装置包括：

12.一种电子设备，包括存储器和处理器，其特征在于，存储器中存储有计算机可读指令，计算机可读指令被处理器执行时，使得处理器执行如权利要求1-10任意一项所述的视频压缩方法。

13.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现如权利要求1-10任意一项所述的视频压缩方法。

...

【技术特征摘要】

1.一种视频压缩方法，其特征在于，所述方法包括：

3.根据权利要求2所述的视频压缩方法，其特征在于，所述通过所述第一特征提取模型提取所述目标视频的所述空间特征，包括：

4.根据权利要求3所述的视频压缩方法，其特征在于，所述通过所述第一特征提取模型提取所述目标视频的所述频域特征，包括：

5.根据权利要求4所述的视频压缩方法，其特征在于，所述结合所述高频信息及所述第一特征提取模型提取所述频域特征，包括：

7.根据权利要求2所述的视频压缩方法，其特征在于，所述将所述空间特征、所述频域特征和所述时序特征通过融合模型进行融合，得到目标视频的特征...

【专利技术属性】
技术研发人员：张新峰，唐律，
申请(专利权)人：中国科学院大学，
类型：发明
国别省市：

网址：视频压缩方法、装置、电子设备及计算机可读存储介质制造方法及图纸 https://www.yuejiaxmz.com/news/view/564610

⬅️上一篇：模型渲染方法、装置、电子设备及存

➡️下一篇：5G时代电子设备发展预测

视频压缩方法、装置、电子设备及计算机可读存储介质制造方法及图纸

相关内容

随便看看

最新动态分享

热点动态分享

专题

推荐动态分享