丁莉,杨琴,姜鹏
中国国家博物馆,北京 100006
摘要
自1980年以来,人们开始利用反射光谱成像技术获取地面遥感数据[1]。随后,该技术日渐成熟并扩展到其他领域,例如工业质量控制、农业食品、制药,以及文化遗产领域。早期,人们应用一维反射光谱识别文化遗产上的材质信息[2-8],自2000年以来,二维的反射光谱的成像技术(高光谱技术)开始应用于各类平面文物,例如油画、壁画、书稿等[9-14]。中国古代书画文物材质脆弱,在大多数情况下无法进行取样分析,而光谱成像技术为古代书画的无损科学数据采集提供了可能,对中国古代书画的价值认知和保护具有重要作用。本工作以文献调研为基础,简要介绍了高光谱成像的原理及技术特点,对高光谱技术在中国古代书画研究的实践进行总结,梳理了国内外研究者利用高光谱技术在书画、档案及相关彩绘文物的增强显示、物质识别、虚拟修复方面的应用案例,以期为相关研究者提供参考借鉴。
高光谱通常是指在波长范围内光谱分辨率小于10 nm的光谱信息。高光谱成像技术在获得目标空间信息的同时,为每个像元提供几十甚至上百个光谱信息。该技术具有以下4个特点:
1)无损测量。采用反射光谱模式,无需接触待测物,对待测物不产生物理损害。
2)光谱范围广。人的眼睛可以感知的电磁波波长一般在0.40~0.76 μm,这一部分在电磁波谱中被称作可见光。高光谱技术可将光谱范围拓展至紫外(<0.40 μm)和热红外区域(0.76~1 000 μm),拓展了人眼无法感知的区域。
3)光谱分辨率高。高光谱传感器能获得可见光、近红外、短波红外、热红外波段多而窄的连续光谱,波段数可达数百个,例如把400~1 000 nm分为300个通道。因此,通过高光谱技术获取到的是一个接近于连续的光谱信息。光谱信息能够反映物质成分内部的物理结构和化学成分的差异。
4)图谱合一。高光谱成像技术将光谱信息和空间位置相结合,在扫描区域内,可获得任一个空间位置的光谱反射率,获得文物表面的光谱差异性分布。
这里需强调的是,在高光谱应用于文物成像之前,人们多用多光谱摄影技术获得可见光以外的成像信息,例如红外摄影、紫外荧光摄影。多光谱采集的数据波段较少,其信息量远小于高光谱。
中国古代书画的可见-近红外光谱成像研究主要集中于中国(表1)[15-41],国外学者更多将该技术应用于油画、壁画、书稿中。在我国,光谱成像在彩绘文物中的应用始于21世纪初,柴勃隆等率先引入多光谱摄影技术,应用于敦煌壁画的内容调查监测。台北故宫博物院与东京文化财研究所合作,对其重要馆藏进行了光学检测,利用红外线透射反射摄影与荧光摄影技术,对画作技法进行了分析。随后,多家博物馆引入高光谱技术,并积极与高校、研究所开展合作。故宫博物院、首都博物馆、四川博物院、上海博物馆、辽宁省博物馆已将书画的高光谱扫描作为日常检测工作。高校与科研院所则投入更多研究力量于中国书画的高光谱数据采集平台创新和数据处理方法开发。故宫博物院与中国科学院遥感与数字地球研究所联合开发了中国书画的大型高光谱扫描平台,面积为2 m×2 m,扫描过程中文物在平台上保持静止状态,光源和探测器移动,提高了扫描效率和文物的安全性[24]。北京建筑大学侯妙乐团队则在传统书画虚拟修复、增强显示等方面,开发了不同的数据处理算法和流程。虽然高光谱技术已开始应用于中国书画的检测,但现阶段大多还只应用于年代较近的书画作品(表1),而对于珍贵的高古书画作品的应用还较少。中国书画作品多为纸本、绢本,属于脆弱、易受损的有机质文物,而高光谱仪在使用时,需配合专用的光源,倘若数据采集时间过长,可能会导致书画表面温度升高、书画中的光敏颜料褪色等风险。因此,在进行高光谱书画信息采集时,文物科技分析工作者尚保持较为谨慎的态度,例如DOOLEY团队在采集油画数据时,采用热成像仪对颜料面板进行实时监测,并保持颜料面板平均升温在2℃以内,以确保符合保护要求[42]。
中国国家博物馆于2020年开展宋元书画光学检测项目,在对光谱采集条件进行了严格的安全性评估的前提下,采集了馆藏十余件宋元书画作品的高光谱数据[43-44]。古书画作品具有流传时间长、艺术价值高、流传经历丰富和历代修复次数多等特点,所蕴含的信息十分丰富。这批珍贵文物的高光谱影像将为更多学者提供研究参考,也为书画的展览展示提供更多学术性素材。
(续表1)
笔者根据近年来国内外报道的最新进展,将高光谱数据在中国书画分析中的应用分为以下几类:1)视觉增强;2)物质识别;3)虚拟修复。本文将着重探讨不同应用方向所采用的常用基本数据处理算法,列举经典案例,以供相关研究人员参考。
3.1 视觉增强
中国书画在流传和保存过程中,可能受到物理摩擦、生物侵蚀、化学降解等作用,出现画面破损、印章模糊甚至表面滋生霉斑等情况——这些病害都会导致书画内容的缺失。运用高光谱成像技术,可提取出隐藏的画面底稿、模糊的印章与文字等信息,增强画面的可读性,其中最常用的方法有直接特征光谱提取、波段运算、主成分分析(PCA)、最小噪声分离(MNF)、密度分割等[10,14,23,27-28,30-31,33-36,38-40,45-53],例如:武望婷等[28]利用MNF第二波段,提取出了画面中的人物线稿信息(图1);巩梦婷等[33]利用MNF与波段运算构建特征指数,提取出了画面中的模糊印章(图2);Wu等[45]分析了墨迹在近红外的特征反射,利用棺木高光谱图像中的1 196 nm波段图像,让肉眼无法识别的文字,清晰地显示出(图3)。此外,在有针对性地提取隐藏信息时,对目标物质的特征谱的判断是十分重要的:以炭黑为主要成分的墨迹信息在近红外区域有较强吸收,因此提取墨迹信息时可考虑近红外波段;朱砂在835 nm具有较高反射率,则在构建特征指数时,可运用该波段。
主成分分析和最小噪声分离是建立在各光谱波段间的重新组合和优化基础上的特征提取,能够降低数据维度、降低噪声、增加物质类别的可分性。其中PCA是一种线性变换,能将原始多波段的数据进行线性变换,得到相同维度的主成分。各主成分分量彼此之间互不相关,第一主成分包含着原始影像数据中最大的信息量,第二主成分其次,以此类推。在分析时,一般保留包含原始影像信息90%变异量的主成分即可。最小噪声分离变换是对主成分变换的一种改进方法,本质上是两次层叠的主成分变换:第一次变换用于分离和重新调节数据中的噪声;第二步是对噪声白化数据的标准主成分变换。最小噪声分离不但能判定图像数据内在的维数,而且能够进一步剔除数据中的噪声。
通过文献总结,MNF在多数类型的书画信息提取中都能取得良好的效果,因此也是在无目标提取物时值得推荐的一种方法。此外,对病害信息的增强显示,还可用于书画的病害评估,例如:Goltz等[51]采用污渍的端元波谱及密度分割,呈现1763年犹太祈祷书(哈加达)第三页上的污渍,并统计了污渍在文稿中的比例(图4);Lin等[54]采用MNF对高光谱数据进行降维,利用BP神经网络的监督分类算法提取壁画中的不同病害(脱落、烟熏、泥渍)(图5);孙美君等[18]采用偏最小二乘回归(PLSR)、PCA+支持向量机(SVM)和PCA+人工神经网络(ANN)等降维及监督分类算法,建立起甲病害的风险评估模型(图6)。然而,高光谱技术用于中国书画的病害评估还鲜有报道。
3.2 物质识别
中国传统书画所采用的基材为纸、绢,纸的主要成分为纤维素,绢的主要成分为蛋白质。书写和绘画所采用的物质主要为墨和书画颜料,墨的主要成分为石墨和胶,书画颜料则可分为天然矿物和天然有机质颜料,近现代书画还可能采用人工合成的颜料。
目前,常用高光谱技术的波长范围为400~2 500 nm,在这个区间内,书画中的各类材质具有其特征的反射光谱。纤维素、蛋白质、有机质胶、颜料中的含氢基团—X—H(X=C、N、O、S)的振动倍频及合频在近红外区域有较强的吸收,其中蛋白质的特征吸收不仅反映了其以氨基酸为单体的物质信息,同时还可以反映蛋白质的二级结构信息,这为区分蛋白质的种类提供可能[55-57]。天然矿物颜料的电子跃迁在反射光谱可见区域中呈现特征吸收带,例如群青(Na8-10Al6Si6O24S2-4)中的电荷转移、朱砂(HgS)中的导带跃迁、石青[(CuCO3)2·Cu(OH)2]中的配体场跃迁等。在近红外区域,有些矿物颜料还含羟基和碳酸盐,这些官能团特征的振动倍频及合频,也可用于识别颜料种类,例如铅白[(PbCO3)2·Pb(OH)2]、石膏(CaSO4·2H2O)。有机颜料在可见光区域内含有自身的电子跃迁特性,例如蒽醌类色素(茜草)具有来自n-π*和π-π*吸收特征。
针对天然矿物,人们已经建立多个经认证的光谱数据库,例如美国地质调查局(USGS-MIN)、喷气推进实验室(Jet Propulsion Laboratory,JPL)、约翰霍普金斯大学(Johns Hopkins University,JHU)、国际地质对比计划项目(IGCP-264)建立了天然矿物反射光谱数据库[58-59]。在文化遗产领域,也有多个研究机构建立了颜料光谱数据库,例如:Antonino Cosentino[60]建立了54种历史上常用的颜料反射光谱数据,波长范围在360~1 000 nm,该数据库免费公开使用;都灵维纳利亚皇宫保护和修复中心建立了古代和现代绘画材料的FORS数据库,包含173种不同的颜料或染料[61];佛罗伦萨硬石工厂(Opificio delle Pietre Dure)修复实验室与意大利国家研究委员会应用物理研究所“Nello Carrara”应用光谱实验室合作建立的FORS绘画颜料数据库(270~1 700 nm)[62]。相较于国外油画的颜料和粘接剂的多样性,中国传统书画颜料的种类相对比较固定(表2);特别的是,不同颗粒度的矿物颜料在中国书画颜料的调制方面十分常见。虽然矿物颜料的颗粒度在使用中影响了颜色的明度,但对其反射光谱特征无明显影响[63-64]。
中国国家博物馆、故宫博物院、中国文化遗产研究院、四川博物院、北京建筑大学等研究机构也建立了中国传统颜料的反射光谱数据库(400~2 500 nm)。通过光谱数据库可进行光谱/一阶导数谱直接比对,还可以采用多种算法进行匹配,例如光谱角填图(SAM)、光谱特征拟合(SFF)、二进制编码(BE)、光谱相关系数匹配算法(SCM)、光谱信息散度算法(SID)等。Liu等[53]利用光谱吸收指数(SAI)和SAM构建了光谱分段识别方法(SSI),选取矿物离子的特征吸收波段(350~550 nm、600~900 nm、700~1 120 nm)及配位离子的吸收波段(1 400~1 600 nm、2 300~2 400 nm)进行匹配,与传统方法相比,提高了匹配准确度。
在实际书画作品中,书画家们往往会采用混合颜料进行调色,因此对混合颜料的解析在实际的应用中十分重要。高光谱解混的过程就是将一个混合像元(包含多种颜料)分解为端元(单一颜料)和计算相对应丰度的问题,高光谱解混分为线性解混和非线性解混。吕书强等[65]提出基于众数的比值导数光谱法进行光谱线性解混。尹琴丽等[66]采用一种基于非负矩阵分解(NMF)的混合颜料线性解混算法。李广华[24]等采用完全约束最小二乘法(FCLS)进行光谱线性解混,得到了石青、石绿、铅白、朱砂等颜料在清代《罗汉肖像画》中的半定量分布信息(图7)。Rohani等[67]在识别混合颜料的端元波谱后,利用Kubelka-Munk模型进行非线性优化,估计各个颜料成分的浓度值。
但是,高光谱在用于书画的颜料识别过程中仍有两个问题:1)有机质的颜料组分识别困难——由于有机质颜料在中国画中属于水色,在画作上的沉积十分轻薄,例如罩色,因此其可见光区域的吸收特征往往不明显;2)基底干扰——当颜料层很薄时,在近红外区域显示出基底层的光谱信息,将导致颜料的光谱不可读。这与壁画、油画等带有厚重颜料层的彩绘不同,也是近红外区域在用于中国书画上的颜料识别时遇到的难题。
美国国家美术馆研究部Delaney等[68]利用近红外光谱成像技术对16世纪的挂毯Triumph of Christ中的丝、羊毛纤维的分布进行了成像分析(图8)。根据此项工作,笔者认为近红外区域的纸、绢的特征光谱不仅利于书画基材的鉴定,还可以应用于检测传统书画中由修补、老化、霉变导致的基材变化。目前为止,利用纤维在近红外区域的吸收特征差异进行材质差异性成像的工作在中国书画方面还未有报道。
3.3 虚拟修复
传统书画修复需通过揭除旧裱、清洗画芯、揭托纸、全色、过矾镇墙等步骤,修复工序复杂、难度大。对于十分脆弱的书画,传统修复技术难以达到预期效果(比如特殊病害的除去),且可能会导致书画不可逆的损害。基于高光谱数据的虚拟修复技术,可通过图像的处理实现书画的虚拟修复,与传统基于RGB颜色系统图像的修复技术相比,高光谱技术提供了非可见区域波段信号用于校正待修复区域。侯妙乐课题组开发了若干虚拟修复的处理方法(图9):1)基于高光谱影像分类线性回归的古画油渍虚拟修复方法,该方法主要针对污溃区域真彩色波段像素值进行处理,首先建立受污溃影响较小的波段与真彩色波段像素值的线性回归方程,再利用该回归方程去校正污渍区域的真彩色波段像素值,从而实现污渍之下的颜料在真彩色波段的显示[69];2)利用MNF提取出污渍的主成分,并选择不包含污渍的主成分进行逆MNF变换,得到去除污渍的图像[70];3)基于Patchmatch色彩约束下泊松图像编辑方法,利用高光谱中污渍不敏感波段作为特征波段,将特征波段图像与原RGB图像进行泊松融合,同时加以Patchmatch色彩约束,还原污渍区域的轮廓和颜色[71]。Han等[41]采取近红外波段1 451 nm作为秦始皇陵出土的2号秦铜车彩绘图案轮廓提取的特征波段,并对色彩完整部分进行颜料的匹配,最终还原出夔龙图纹(图10)。相较于增强显示和物质识别,虚拟修复需使用更加复杂的图像处理算法,高光谱数据提供了比RGB图像更丰富的波段信息,为虚拟修复提供数据支持。
3.4 基于高光谱数据的中国书画分析流程
表3总结了近年来高光谱技术在中国书画及其他类型彩绘文物中应用的研究论文。笔者从中提炼出了针对物质识别、视觉增强及虚拟修复为目的数据基本流程(图11),该流程可为初学者提供参考,适合于博物馆从业人员的入门学习和实践。
(续表3)
(续表3)
高光谱技术具有无损检测、光谱范围广、光谱分辨率高、图谱合一等特点,可在中国书画的成像分析中得到丰富的信息。该技术在国内多家博物馆已得到实践和应用,高校及相关科研机构也已陆续开展各类数据处理算法和流程的开发:1)在增强显示方面,已开发了针对中国书画线稿、印章等信息的提取方法,然而针对书画的物理病害(例如缺失、残损、褶皱、断裂等),仍需发展其提取和定量统计的方法;2)在物质识别方面,颜料的分析已相对成熟,并且也有若干光谱库作为参考,但是由于书画纤维基底在近红外区域的光谱干扰,对于有机颜料或颜料层较薄的情况,仍需其他手段(例如拉曼光谱分析、元素分析、色谱-质谱分析等)相结合;另一方面,近红外区域纸、绢的特征光谱则有望用于书画基材的鉴定,以及有关老化程度、生物病害的研究;3)在虚拟修复方面,基于高光谱数据的虚拟修复技术与传统的基于RGB图像的修复技术相比,提供了非可见区域波段信号用于校正待修复区域,在未来研究中需要试验和尝试更多的处理方法。
最后,高光谱作为一种大幅面的成像技术,仍需进一步将其成像的分析结果普及,实现应用闭环,例如:将视觉增强信息与书画价值研究相结合,以期解决更多书画研究的难题;将视觉增强、物质识别及虚拟修复的科技分析结果与展览相结合,为观众鉴赏古书画提供新的视角和学术内涵。
(转自:微信公众号 文物保护与考古科学)