本文共 3016 字,大约阅读时间需要 10 分钟。
众所周知,屏幕共享是实时音视频互动中十分重要的一项功能,能够帮助参会者访问另一台计算机或桌面的内容,从而实现文档、图片、多媒体等的实时共享。而在实现屏幕共享的过程中,我们就不得不来聊一聊抓屏技术。看看唐桥科技音视频PaaS平台是如何根据抓屏技术特性来实现最优的抓屏效率和最佳的用户体验。Windows系统上有很多抓屏技术,不同的抓屏技术又局限于Windows系统版本,没有一种通用的抓屏技术可以高效的抓取屏幕图像,其中主要的原因是操作系统的显示驱动模型在从XDDM向WDDDM转变,应用层的API也在从GDI向D3D转变。本文重点关注SCC如何集成各种抓屏技术以兼容所有Windows系统。
01 显示器驱动程序模型
Windows 显示驱动程序模型要求图形硬件供应商提供配对的用户模式显示驱动程序和内核模式显示驱动程序。
windows 2000 显示器驱动程序模型 (XDDM)。XDDM 是为 Windows 2000 到 Windows Vista 和 Windows 7 提供的显示/图形驱动程序体系结构。
从上图可以看出,其核心模块是GDI。在XDDM下我们可以采用GDI技术抓屏。
WDDM 是从 Windows Vista 开始提供的显示/图形驱动程序体系结构
从上图可以看出其核心模块是D3D,同时还兼容了GDI。那么在WDDM下我们可以采用基于D3D的一些抓屏技术。
02 抓屏技术
那么GDI抓屏技术有什么优点和缺点呢?
优点:从XDDM到WDDM的架构设计上都是支持GDI,
所以GDI抓屏适用Windows2000及以后平台。
缺点:效率低、最大帧率小于20帧,CPU消耗高,vista之后就不支持过滤窗口。
那么DXGI抓屏技术有什么优点和缺点呢?
优点:效率高、最大帧率可达80帧,CPU消耗低。
缺点:不支持win7及以下Windows版本,不支持过滤某个窗口。
下面介绍一下win8及以上系统如何通过hook获得抓屏数据。
Hook分类如下图所示:
我们使用了HotFix Hook,下面简单介绍一下技术原理和实现方式。
API起始代码有如下两个明显的相似点:
[1]API代码以“MOV EDI,EDI”指令开始。
[2]API代码上方有5个NOP指令
MOV EDI,EDI用于将EDI的值再次复制给EDI,这没有什么实际意义。也就是说,API起始代码的MOV指令(2个字节)与其上方的5个NOP指令(5个字节)合起来共7个字节的指令没有任何意义。所以我们就可以通过修改这7个字节来实现Hook操作。
Magnification API抓屏技术又有什么优点和缺点呢?
优点:支持过滤某个窗口,CPU消耗低。
缺点:效率低,最大帧率20帧左右。
03 音视频平台抓屏技术策略选择
首先我们通过一张表格直观了解一下各个抓屏技术的优缺点。
我们的择优顺序是过滤窗口,高帧率,低CPU消耗。
根据上面的择优思路,就形成了一套探测策略,用思维导图来了解一下。可以看到有几个关键节点的判断:
1. 判断运行平台的Windows系统版本
2. 判断是否能支持D3D运行环境
3. 判断是否支持DXGI运行环境
4. 判断是否开启Aero特效
这些判断保障了我们能选择出最优的抓屏方案。
04 总结
通过本文,我们了解到GDI, DXGI, Magnification AP, Hook D3D等抓屏技术,以及我们的探测策略。
在屏幕共享和程序共享中,唐桥科技的音视频PaaS平台将根据抓屏技术特性来实现最优的抓屏效率和最佳的用户体验。
唐桥科技,云通信专家,是专业的智能实时音视频PaaS及SaaS云服务提供商。致力于三网融合视频通讯平台的研发和在不同领域的应用,已经与多项行业应用深度结合,推出了远程医疗、在线教育、视频云会议、互动医教、视频面试、智慧法院等一系列行业解决方案,为全球百余家企业提供专业音视频通讯服务。在此基础上,唐桥科技将多年积累的音视频技术以SDK/API的形式开放给企业及开发者,降低技术门槛,让企业跑得更快。
转载地址:http://uynzx.baihongyu.com/