Alpha合成

在计算机图形学领域中，Alpha合成（英語：alpha compositing），又称Alpha混合（英語：alpha blending），是一种将图像与背景结合的过程，结合后可以产生部分透明或全透明的视觉效果。Alpha合成也叫阿尔法合成或透明合成。渲染图像时，通常会将目标图像中的多个子元素单独渲染，最后再把多张子元素的图片合成（英语：Compositing）为单独的图像。例如，电视直播时就会将大量计算机生成的图像元素合成到现场镜头上。

要正确结合图像元素，每个元素的必须有对应的遮片（英语：Matte (filmmaking)）。遮片包含覆盖范围信息——图中几何对象的形状——可以藉此分辨图像中的任意位置到底是被绘制的几何对象本身，还是逻辑上的「空白」区域。

描述

为了保存遮片信息，匠白光提出了Alpha通道的概念，后由托马斯·波特（英语：Thomas K. Porter）和汤姆·达夫（英语：Tom Duff）完善。^[1]二维图像里记录着每个像素的颜色信息，额外的信息以 0 和 1 之间的值表示，记录在Alpha通道里。0 表示该像素没有覆盖信息，是透明的，即图中的几何体没有覆盖到本像素；而 1 则表示像素不透明，几何体完全覆盖了此像素。

图像中使用的Alpha通道通常有两种表示形式：平直Alpha（英語：straight alpha）和预乘Alpha（英語：premultiplied alpha）。

如果使用平直Alpha，图像中的RGB分量仅表示像素的颜色，与是否透明无关。
如果使用预乘Alpha，图像中的RGB分量也表示像素的颜色，但事先已经和不透明度做了乘法。某些使用场景下，这样的做法可以在后续合成时节省一次乘法。不过预乘Alpha的最显著优势在于使用简单、准确而非性能。^[2]

如果用平直的（非预乘）RGBA 元组表达像素颜色，那么像素值 (0, 0.7, 0, 0.5) 表示像素有 70% 的最大绿色亮度，同时不透明度是 50%。同样条件下的纯绿色是 (0, 1, 0, 0.5)。而如果用预乘Alpha，此处的 RGB 值 (0, 0.7, 0) 需要都乘以 0.5，表达为 (0, 0.35, 0, 0.5)。虽然此处 G 通道的值是 0.35 ，但它表示的还是最大亮度的 70%（其中包含了 50% 的不透明度）。此时的纯绿色则需要表达为 (0, 0.5, 0, 0.5)。因此，了解图像（文件）到底使用的是平直Alpha还是预乘Alpha非常重要，只有这样才能对图像做正确的处理和合成。

有了Alpha通道，图片的合成操作就可以用合成代数（英语：Composition algebra）的形式表达。假设有图像元素 A 和 B，最常见的合成操作就是把 A 作为前景、B 作为背景，我们称这种操作（运算）为 over，记作 $A\operatorname {over} B$ 。除此之外，波特和达夫还定义了其它几个运算符：in、out、atop、xor：

运算符 over 的效果与普通绘画效果一致（见画家算法），运算符 in 则等价于裁剪。

以运算符 over 为例，运算结果相当于对图像中的所有像素做以下公式：

\alpha _{o}=\alpha _{a}+\alpha _{b}\left(1-\alpha _{a}\right)

C_{o}={\frac {C_{a}\alpha _{a}+C_{b}\alpha _{b}\left(1-\alpha _{a}\right)}{\alpha _{o}}}

其中 $C_{o}$ 是运算结果， $C_{a}$ 是图像 A 中的像素， $C_{b}$ 是图像 B 中的像素，而 $\alpha _{a}$ 和 $\alpha _{b}$ 则分别是图像 A、B 中对应像素的Alpha值。

如果假设颜色值都是预乘了Alpha值的（ $c_{i}=\alpha _{i}C_{i}$ ），那么我们就可以将等式进行改写，结果图像中的颜色即：

c_{o}=c_{a}+c_{b}\left(1-\alpha _{a}\right)

结果中的Alpha值即：

\alpha _{o}={\frac {c_{o}}{C_{o}}}=\alpha _{a}+\alpha _{b}\left(1-\alpha _{a}\right)

over 运算符的解析推导

通过研究正交覆盖，Porter 和 Buff 给出了 alpha 合成的几何解释。在 1981 年 Bruce A. Wallace 的论文里则给出了另一种基于的反射率/透过率的物理模型的另一种推导。^[3]

第三种推导方法通过使用两条简单的假设得到。为了简单起见，我们将 over 运算符简记成 $a\odot b$ 。

第一条假设是当背景是不透明（即 $\alpha _{b}=1$ ）时，over 运算符表示前景颜色与背景颜色的凸组合：

C_{o}=\alpha _{a}C_{a}+(1-\alpha _{a})C_{b}

第二条假设是这种运算应该满足结合律：

(a\odot b)\odot c=a\odot (b\odot c)

现在，可以假设 $a$ 和 $b$ 包含不透明度分量，而 $c$ 不包含。考虑中间变量

o=a\odot b

由于结合律成立，有

o\odot c=a\odot (b\odot c)

由于 $c$ 是不透明的，因此 $b\odot c$ 也是不透明的。由第二条假设，在上面的式子中，上式地每个 $\odot$ 运算都可以用凸组合表达：

{\begin{aligned}\alpha _{o}C_{o}+(1-\alpha _{o})C_{c}&=\alpha _{a}C_{a}+(1-\alpha _{a})(\alpha _{b}C_{b}+(1-\alpha _{b})C_{c})\\&=[\alpha _{a}C_{a}+(1-\alpha _{a})\alpha _{b}C_{b}]+(1-\alpha _{a})(1-\alpha _{b})C_{c}\end{aligned}}

这个式子的两边都满足 $X_{0}+Y_{0}C_{c}=X_{1}+Y_{1}C_{c}$ 的形式，令 $X_{0}=X_{1}$ 且 $Y_{0}=Y_{1}$ ，可以得到：

{\begin{aligned}\alpha _{o}&=1-(1-\alpha _{a})(1-\alpha _{b}),\\C_{o}&={\frac {\alpha _{a}C_{a}+(1-\alpha _{a})\alpha _{b}C_{b}}{\alpha _{o}}},\end{aligned}}

至此，我们推导出了 $o=a\odot b$ 的颜色和其 alpha 分量的解析式。

注意到 $(1-\alpha _{a})\alpha _{b}=\alpha _{o}-\alpha _{a}$ ，这样，上式可以紧凑地表示成

C_{o}={\frac {\alpha _{a}}{\alpha _{o}}}C_{a}+\left(1-{\frac {\alpha _{a}}{\alpha _{o}}}\right)C_{b}

$\odot$ 运算符满足非交换幺半群的定义。这个群的单位元 $e$ 是所有满足 $\alpha =0$ 的二元组 $\langle C,\alpha \rangle$ ，这可以通过式子 $e\odot a=a\odot e=a$ 得到。

Alpha混合

Alpha混合（英語：alpha blending）是将半透明的前景色与背景色结合的过程，可以得到混合后的新颜色。前景色的透明度不限，从完全透明到完全不透明都可以。如果前景色完全透明，混合后的颜色就是背景色；如果前景色完全不透明，混合后的颜色就是前景色；如果在这两种极端情况之间，混合后的颜色可以通过前景色和背景色的加权平均计算。

Alpha合成后的颜色可以这样计算：

{\begin{cases}\mathrm {out} _{A}=\mathrm {src} _{A}+\mathrm {dst} _{A}(1-\mathrm {src} _{A})\\\mathrm {out} _{RGB}={\bigl (}\mathrm {src} _{RGB}\mathrm {src} _{A}+\mathrm {dst} _{RGB}\mathrm {dst} _{A}\left(1-\mathrm {src} _{A}\right){\bigr )}\div \mathrm {out} _{A}\\\mathrm {out} _{A}=0\Rightarrow \mathrm {out} _{RGB}=0\end{cases}}

如果背景色不透明，即 $dst_{A}=1$ ，代入上述方程后可以得到：

{\begin{cases}\mathrm {out} _{A}=1\\\mathrm {out} _{RGB}=\mathrm {src} _{RGB}\mathrm {src} _{A}+\mathrm {dst} _{RGB}(1-\mathrm {src} _{A})\end{cases}}

如果使用了预乘Alpha，最初的方程组可以简化为：

{\begin{cases}\mathrm {out} _{A}=\mathrm {src} _{A}+\mathrm {dst} _{A}(1-\mathrm {src} _{A})\\\mathrm {out} _{RGB}=\mathrm {src} _{RGB}+\mathrm {dst} _{RGB}\left(1-\mathrm {src} _{A}\right)\end{cases}}

伽玛校正

计算机图像一般不直接存储光照亮度对应的 RGB 值，而是需要先对这些值做伽玛校正。

伽玛校正的大致过程如下：

设 $displayed_{RGB}$ 为屏幕上显示的 RGB 亮度（标准化后的亮度值，在 0 和 1 之间）
设 $stored_{RGB}$ 为计算机内存中所存储的 RGB 亮度（也是标准化后的亮度值）
设 $\gamma$ 为用于「解码」 $stored_{RGB}$ 图像的伽玛值 2.2（2.2 为 $\gamma$ 的典型取值）

则它们三者之间的关系为

displayed_{RGB}={stored_{RGB}}^{\gamma }

因此，在处理计算机图像的 RGB 值时（尤其是做 Alpha 混合时），可以在处理前先将伽玛校正消除，完成处理后再重新做伽玛校正，这样做的效果比直接处理伽玛校正后的 RGB 值要好。

例如有一张图片 $overlay_{rgb}$ ，它对应的 Alpha 通道为 $overlay_{\alpha }$ ，现在要把它叠加到背景图 $background_{rgb}$ 上，那么最终的图像 $out_{rgb}$ 可以这样计算：

out_{rgb}=({overlay_{rgb}}^{\gamma }\times overlay_{\alpha }+{background_{rgb}}^{\gamma }\times (1-overlay_{\alpha }))^{1/\gamma }

此处的 $out_{rgb}$ 是计算机内存中所存储的数据；在计算机显示器上会以 $out_{rgb}^{\gamma }$ 的数据显示。

参考资料

^ Porter, Thomas; Tom Duff. Compositing Digital Images. Computer Graphics. 1984, 18 (3): 253–259. ISBN 0-89791-138-5. doi:10.1145/800031.808606.
（见 pixar.com. （页面存档备份，存于互联网档案馆））
^ TomF's Tech Blog - It's only pretending to be a wiki.. tomforsyth1000.github.io. [8 May 2018]. （原始内容存档于2017-12-12）.
^ Wallace, Bruce A. Merging and transformation of raster images for cartoon animation. SIGGRAPH Computer Graphics (New York City, New York: ACM Press). 1981, 15 (3): 253–262. ISBN 0-89791-045-1. doi:10.1145/800224.806813.

计算机图形学

二维计算机图形

Alpha合成
图层
矢量图形
像素

2.5D	等轴测图形（英语：Isometric video game graphics） Mode 7 视差滚动光线投射（英语：Ray casting）天空盒（英语：Skybox (video games)）

三维计算机图形

三维投影
三維渲染
照明 (计算机图形学)（英语：Computer graphics lighting）
- 全局光照
- 光线追踪
消隐（英语：Hidden-surface determination）
多边形网格
- 三角形网格（英语：Triangle mesh）
着色
表面三角化（英语：Surface triangulation）
线框模型

概念

仿射变换
- 平移
- 旋转
- 缩放
- 错切
背面剔除（英语：Back-face culling）
裁剪 (计算机图形学)（英语：Clipping (computer graphics)）
碰撞检测
平面投影（英语：Planar projection）
渲染
- 卡通渲染
- 非真实感绘制
虚拟现实
混合现实
计算机动画

图形软件

三维计算机图形软件
點陣圖圖像編輯器
矢量图形编辑器列表
图形应用程序接口
- Direct3D
- OpenGL
- Vulkan
- Metal

算法

反锯齿	双线性过滤三线性过滤（英语：Trilinear filtering）各向异性过滤快速近似抗锯齿（FXAA）深度学习超级采样（DLSS）

全局光照	环境光遮蔽图像照明光子映射辐射度算法光线追踪

着色	Phong着色法 Gouraud着色法延迟着色阴影贴图阴影体