大脑如何执行审美?


对于不同风格的艺术作品 , 人们的主观偏好不尽相同 。 然而其背后的逻辑 , 却能够使用客观的高层及低层特征加以描述和解释 。 这是加州理工的科研团队在Nature Human Behaviour5月20日的论文[1]得出的出人意料的结论 。

大脑如何执行审美?
本文插图
尽管萝卜白菜各有所爱 , 每个人偏爱的艺术风格会有所不同 , 但是对视觉艺术品的欣赏都是人生体验中不可或缺的一部分 。 正如哲学家康德所说 , 艺术本身是客观且普世的 , 有些艺术品就是能够跨越时空 , 获得大多数人的喜爱 。
但一方面艺术是普世的 , 一方面艺术鉴赏又是因人而异的 , 这样就引出了如下问题:为什么人们都能够发现优秀作品的美?是否存在某些特征 , 不论个体的审美偏好 , 都能让大脑觉得“美”?(相关阅读:大脑中存在美的加工中心吗?)
为了回答这一问题 , 实验人员分别邀请1359名受试者 , 使用亚马逊众包平台 , 对随机抽取的、包含各种艺术风格的60幅绘画作品进行打分;以及7名受试者 , 在实验室中对1001幅绘画进行打分 。 随后 , 研究者将绘画替换为716幅摄影作品 , 重复了上述实验 , 发现无论在绘画或摄影这两种场景下 , 线性特征累积模型(Linear feature summation , LFS)都能够基于深度学习提取的高层(色调对比度 , 饱和度)及低层(灰度、明度、饱和度)特征 。
通过线性累加 , 预测受试者的审美偏好的打分 。 由于预测模型使用的特征 , 对照片和图片两种不同来源的数据都适用 , 故此作者指出视觉审美过程中使用的特征 , 与审美对象本身无关 , 而是跨越艺术品风格通用 。

大脑如何执行审美?
本文插图
可基于色调 , 对比度 , 饱和度等低层特征 , 以及明亮程度 , 具象等高层特征预测对艺术品的审美偏好
通过聚类分析 , 将对受试者进行在线分析 , 可分为三类 , 如下图所示 。 其中占比最多的蓝点 , 表示这些受试者偏好风景画和印象派的作品;红点代表偏好有冲击力或有动感的作品 , 例如立体派(cubism);而第三类则喜欢不那么描摹实物 , 差异比较大的抽象派艺术品 。

大脑如何执行审美?
本文插图
对在线受试者的艺术偏好的聚类图展示了人们关注的特征主要呈现在具象性 , 动感及变化大小三个维度

大脑如何执行审美?
本文插图
不同聚类对应的图片特征间的相关性热图 , 可以看出与每一种审美类型最相关的类型对应的特征
2017年 , Nature neuroscience 上曾发表过一篇类似的研究[2] 。 该文从大脑功能核磁影像数据出发 , 研究人类如何产生对食物的偏好 , 并发现大脑是根据食物中碳水 , 蛋白质 , 脂肪的占比来对食物进行打分 , 从而产生不同的偏好 。
研究者据此开发出模型 , 通过fMRI数据预测不同人对不同食物的评分 。 然而 , 艺术品比食物的复杂度高出许多 , 其可能的变化也更多 , 这使得找到影响艺术品鉴赏力的因素更具有挑战 。
为此 , 研究者使用能模拟大脑处理视觉信号的模型 , 从艺术品中提取视觉特征 。 认知神经科学已经证明 , 用于图像识别的深度卷积网络 , 作为最常用的深度学习模型 , 其层次化的处理流程 , 和大脑中的视觉皮层 , 有相近之处 。 而该研究所使用的VGG16 , 常用于图像识别 , 包含13个卷积层和两个全连接层 , 从而可用于进行图像识别的ImageNet训练 。
卷积神经网络中 , 层数越深 , 特征越抽象 。 因此对于低层特征 , 例如色调、平均饱和度、基于较低层神经网络得出特征做的预测 , 其准确性更高;而对于高层特征 , 例如绘画是否有动感、是否描摹实物 , 则需要使用更深的神经网络提取特征 , 才能达到更高的预测准确性 。 如下图所示 。

大脑如何执行审美?
本文插图
使用不同深度的神经网络 , 以及不同类型的特征 , 预测审美偏好的准确度的折线图
这可以说明两点 , 一是打破通常以为的“深度学习模型是一个不可解释的黑箱”这一认识:意味着可以用卷积神经网络中的计算复杂度 , 估计大脑从艺术品中抽取特征时的计算复杂度 。
二是指出 , 虽然神经网络越深 , 预测准确性越高 , 但这不意味着艺术审美的偏好 , 只取决于高层特征 。 使用众多低沉特征的线性组合 , 同样可以得到相近的预测精度 。

推荐阅读