监督机器学习——基于脑电方法测量不同室温下的热舒适

这是“神经工程管理”第47篇推送

内容来源：薛朋东

本期编辑：朱红

校对：侯彩霞

审核：郭晓彤

仅用于学术交流，原文版权归原作者和原发刊所有

引言：本文是针对论文《监督机器学习之基于脑电方法测量不同室温下的热舒适》（Supervised machine learning of thermal comfort under different indoor temperatures using EEG measurements）的一篇论文解析，该论文于2020年发表于《ENERGY AND BUILDINGS》，作者为Xin Shan和 En-Hua Yang。

思维导图

摘要和关键词

利用基于脑电测量的机器学习技术，对居住者实时热舒适状态进行分类，并有可能通过由被试的舒适感知度驱动一种时变设定点，来调节通风和空调系统，以节省更多的建筑能耗。
比较了不同机器学习技术的性能：LDA分类器的性能最好，第二好的是NB分类器，相对差的是KNN分类器。
探讨了选择线性连续特征进行类插值的方法。

关键词:机器学习脑电图监督学习热舒适人体感知

研究背景

建筑行业占全球能源消耗的30%以上，机械通风(ACMV)系统是建筑能源消耗的主要来源之一。ACMV系统的目的主要是提供热舒适的室内环境。现有的热舒适模型主要基于ASHRAE55标准，该标准通过温度、相对湿度、空气速度综合影响来工作，使室内有舒适的热环境，基于现有模型和标准的时不变设定点，而没有考虑一些重要的时变因素（比如居住者对环境的适应状况，又比如居住者在一天内不同时间身体的不同状况），可能导致能量效率低下。因此，当热舒适的实时变化需要较少的能量输入时，可以通过获得居住者的实时热舒适状态并相应地采用时变设定点来实现节能。

研究现状

1）用在线报告或者问卷获得居住者的热舒适状态：

一些研究试图通过在线报告的方法获得居住者的实时热舒适状态，例如，从被试那里获得关于热舒适和其他室内环境方面感受的实时反馈。然而，基于调查的方法需要居住者主动、连续地输入他们的实时热舒适状态，这在实践中很难实现。

2）用生理测量获得居住者热舒适状态

其他一些研究表明，生理测量可用于被动获得热舒适状态，如CO₂、动脉血氧饱和度、唾液中的生物标志物和泪膜质量等。但是，在实践中比较难以实现同步测量，因为可能需要在实验室收集并且通过化验分析生物样本。

当与被动的、实时的测量结合起来使用时，机器学习技术不失为一种更好地对居住者的实时热舒适状态进行分类的方法。机器学习技术可以基于大数据找到规律并做出决策，这些技术包括基于统计模型的监督学习和无监督学习、无模型强化学习或更普遍的人工神经网络。

此外还有一种可以对居住者的热舒适进行实时、被动测量的方法——脑电图(EEG)，这是一种记录大脑活动的电生理技术。脑电图已经在以前的热舒适研究中进行了探索。热舒适也被定义为对热环境表示满意的心理状态。所以，可以将基于机器学习的脑电图研究技术与建筑居住者的热舒适性结合在一起进行研究。

对于脑电研究中的机器学习技术，通常使用监督学习。监督学习的基本思想是用已标记的数据(其类别事先是已知的)训练一个分类器(基于模型的或无模型的)，然后这个用分类器预测相似的数据的类别——类别通常在特定的研究领域中预先定义，例如情绪研究中的不同情绪类别，或者工作负荷研究中的不同水平的精神工作负荷。

对于基于机器学习的脑力负荷/警觉性研究，不同程度的工作量或警惕性是由不同难度的心理任务引起的。在先前研究中，水平被分为很少的类别(例如，只有高、中、低水平)，并且心理状态也被假定为连续的。然而，当需要在这些已建立的级别之内或之外的更精确的级别时，这种有限数量的已建立的类别可能会对未来的应用造成问题。例如，如果需要更精确地识别已建立的高水平和中等水平之间的心理负荷，则需要通过额外的实验来获取和收集该心理负荷水平的脑电图数据。根据所需的精度，可以通过更多的实验建立更有区别的脑力负荷水平，但这可能会受到有限资源的限制。

研究问题

本研究的目标是利用脑电图测量来研究不同室内温度下热舒适的监督机器学习。首先探讨了机器学习方法的适用性，并比较了不同机器学习技术的性能。本研究中的类别是不同室内温度下休息或工作条件下的热舒适状态。其次，探索了插值不同类的方法，这是一种在不进行额外实验的情况下建立更多类别的方法。基于脑电图测量的机器学习方法可能有助于改善居住者的热舒适性，并且当热舒适性的实时变化需要较少的能量输入时，也有助于节能。

研究方法

1.实验环境

实验房间长4.7米、宽3.1米、高2.6米，空调和机械通风(ACMV)是风机盘管系统，房间内的空气温度可以通过ACMV和独立加热器的控制进行调节。热辐射温度的影响被认为是可以忽略的，因为房间没有阳光照射，没有窗户或热辐射不对称，因此，本研究将空气温度作为工作温度。实验中研究了三个温度水平：23、26和29摄氏度（分别标记为冷、中和暖状态），其他环境参数保持相对相同。

2.被试选择

从大学生中招募了22名被试，身穿T恤和长裤，0.57clo（服装热阻）级别。每个被试都经历了所有三种热条件，每天有三个实验时段：10:30–12:30、13:00–15:00、15:30–17:30。每个被试都参加了三天的实验，每天选择相同的时间段。

3.实验流程和数据收集

问卷用于调查被试对室内环境方面的主观感受，计算机化的任务(例如短期记忆任务)也被用来评估被试的工作表现。用EPOC脑电设备分别收集在休息和任务状态下监测被试的脑电图数据。这是一款高分辨率、非侵入性和便携式无线脑电设备，它有14个电极通道，分别位于AF3、F7、F3、FC5、T7、P7、O1、O2、P8、T8、FC6、F4、F8、AF4，CMS和DRL两个额外频道是参考电极。建筑物电力系统的噪音(50/60赫兹)已经被过滤，数据通过专用的蓝牙或者连接USB接口发送到笔记本电脑，被试佩戴脑电设备图以及电极位置如图1所示。

图1.Emotive EPOC 无线脑电设备

（1）被试佩戴示意图

（2）电极位置示意图

每个阶段的主要实验步骤如图2所示。

图2主要实验流程

①适应环境~0-40min

②问卷Ⅰ~40-50min

③休息脑电图测量~50-70min

④任务脑电图测量~70-100min

⑤问卷Ⅱ~100-120min

在休息脑电图条件下，被试被要求睁着眼睛放松地坐着，不做任何事情。对于任务脑电图条件，所有被试做同样的基本脑力工作，例如短期记忆任务。

在实验中，脑电图结果表明，对于额叶不对称活动，中性热环境导致相对更积极的情绪。脑电图休息额叶不对称活动与问卷中的热可接受性指标更相关，这表明中性环境被认为是最可接受的。脑电任务额叶不对称活动也与任务绩效相关，表明中性环境下会有更好的任务绩效。

本研究还使用了三种基于机器学习的脑电模式识别技术，即线性判别分析（Linear discriminant analysis classifier（LDA））、朴素贝叶斯（Naive Bayes (NB)）和K最近邻（K-nearest neighbor（KNN））。这些分类器来自Matlab统计工具箱，都有比较快的训练和预测速度。

同时，本研究依据每个被试的脑电图特征进行分类器的选择，因为脑电图人与人之间的差异通常很大。通过数据分类率比较了线性判别分析、神经网络和KNN分类器的性能。分类率计算如下:对于每个被试1)每个被试数据的一半被随机选择用于训练，剩余的一半被保留用于分类；2)根据训练数据进行特征选择、方差分析，用训练数据训练对应被试的分类器，以及利用其分类器对分类数据进行分类。分类率计算：正确分类数据的百分比，然后比较不同分类器的分类率。

寻找线性连续特征进行类插值的方法：根据冷、暖条件下的实验数据对中性条件进行插值，然后使用中性条件下的实验数据来检验这种插值的性能。该方法如下:对于每个被试的个体特征1)作为冷条件和暖条件下的平均值，获得中性条件下的插值平均值；2)考虑了中性条件下插值标准差的三种情况：冷条件和暖条件下标准差的均值、最小值和最大值；3)然后通过使用插值平均值和插值标准差的正态随机数函数生成中性条件下的插值数据；4)利用冷、暖条件下的实验数据和中性条件下的插值数据训练线性判别分析分类器；5)用训练好的线性判别分析分类器对中性条件下的实验数据进行分类。最后，如果这个分类率通过了一个令人满意的阈值，那么这个特征被认为是线性连续的。由于这里检查了每个单独特征各自的插值性能，只要分类率阈值远高于随机率(即33%)，分类率阈值就被认为是令人满意的，因为模型是单变量的，而不是多变量的。需要注意的是，较高的分类率表示三种热条件下的平均值应该相差足够大，标准差应该足够小。

结果和讨论

环境测量和人体热感觉投票

用空气速度计记录温度、相对湿度和空气速度，二氧化碳由二氧化碳测量仪记录。数据记录在被试附近的座位，与其水平。结果如表1所示，实验温度接近目标温度。

表1 人体附近的环境测量和热感觉投票

热感票：23摄氏度有点冷，26摄氏度是中，29是微热——根据ASHRAE标准55（1是冷的，4是中性的，7是热的）。

不同分类器的性能和用于类内插和外推的线性连续特征

总的来说，这三个分类器可以在休息和工作条件下的特定特征范围内对居住者的实时热舒适状态进行分类。因此，当热舒适的实时变化需要较少的能量输入时，可在ACMV系统中采用时变设定点来实现节能。

结果表明，线性连续特征对于内插可能表现得相对较好，但是对于外推可能不一定表现得很好。这可能是由于所选特征不是完全线性的，因此外推会放大误差，特别是对于本研究中的大范围温度条件。这也说明插值更可靠。

结论和展望

在这项研究中，机器学习技术与被动脑电图(EEG)测量相结合，探索分类不同室内温度下居住者的实时热舒适状态。比较了不同分类器的性能，研究了选择线性连续特征进行类插值的方法。

结论

1. 对于完整的特征集，不同分类器的性能都是令人满意的，分类率都在90%以上。LDA分类器的性能最好，第二好的是NB分类器，相对最差的是KNN分类器。

2. 不同分类器的特征约简模式不同。LDA分类器在大约100–150个特征处有一个鞍点，而NB和KNN分类器单调递减。从全套特征到LDA分类器的鞍点位置，LDA分类器的准确率最高，NB分类器居中，KNN分类器最差。在这个范围内，LDA分类器在人类受试者中也具有最小的标准差，而NB和KNN分类器具有相似的较大标准差。

3. 线性连续特征采用插值方法选取。对于静止状态和任务状态，通过33%阈值的特征的平均数量约为60-70，这些特征的平均分类率约为60%。选择阈值越高，选择的特征越少，但这些特征的平均性能越高，即平均分类率越高。线性连续特征的个数和平均比率对标准偏差的插值方式不是很敏感。

4. 线性连续特征也通过外推法进行检查，分类率主要集中在10-40%的范围内，接近33%的随机率，因此不可行。

展望

一般来说，基于脑电图的机器学习方法可以被动地对居住者的实时热舒适状态进行分类，因此，当热舒适的实时变化需要较少的能量输入时，通过采用时变设定点，具有节能的潜力。此外，线性内插方法提供了一种内插实验无法获得的数据的方法。这种方法应该在更窄的温度区间内工作得更好，这可以通过更多的实验热条件来实现。数据外推的结果不令人满意，因此，在未来的研究中，超出当前研究范围的水平应进行实验研究，因为这在其他国家和地区可能很常见。特别是对于分类器，本研究建立了依赖于用户的模型，其中忽略了人与人之间的差异。在目前的情况下，人与人之间的差异之一是由于性别和代谢率等个人差异造成的不同热感觉，这可以从表1中的热感觉变化中看出。有些人的热感票从团体的意义上向上或向下转移。未来的研究应该考虑这种人与人之间的差异，也可以通过招募更多的人来控制这些人与人之间的差异，从而构建独立于用户的分类器。

引用格式：Shan X , Yang E H . Supervised machine learning of thermal comfort under different indoor temperatures using EEG measurements[J]. Energy and Buildings, 2020, 225:110305.