16 KiB
后记:使用负责任的AI仪表板组件进行机器学习模型调试
课前测验
简介
机器学习正在影响我们的日常生活。人工智能正在逐步渗透到一些对个人和社会至关重要的系统中,例如医疗、金融、教育和就业领域。例如,系统和模型参与了日常决策任务,如医疗诊断或欺诈检测。因此,随着人工智能的快速发展和广泛应用,社会对其的期望也在不断变化,同时相关法规也在逐步完善。我们经常看到人工智能系统未能达到预期的领域,它们暴露出新的挑战,而各国政府也开始对人工智能解决方案进行监管。因此,分析这些模型以确保其为所有人提供公平、可靠、包容、透明和负责任的结果是非常重要的。
在本课程中,我们将探讨一些实用工具,这些工具可以用来评估模型是否存在负责任的人工智能问题。传统的机器学习调试技术通常基于定量计算,例如总体准确率或平均误差损失。然而,想象一下,当您用于构建这些模型的数据缺乏某些人口统计信息(如种族、性别、政治观点、宗教)或这些人口统计信息被不成比例地代表时会发生什么情况。如果模型的输出被解释为偏向某些人口统计信息,这可能会导致这些敏感特征组的过度或不足代表,从而引发模型的公平性、包容性或可靠性问题。此外,机器学习模型通常被认为是“黑箱”,这使得理解和解释模型预测的驱动因素变得困难。这些都是数据科学家和人工智能开发者在缺乏足够工具来调试和评估模型的公平性或可信度时面临的挑战。
在本课程中,您将学习如何使用以下方法调试模型:
- 错误分析:识别模型在数据分布中错误率较高的区域。
- 模型概览:对不同数据群体进行比较分析,发现模型性能指标中的差异。
- 数据分析:调查数据是否存在过度或不足代表的情况,这可能导致模型偏向某些数据群体。
- 特征重要性:了解哪些特征在全局或局部层面驱动模型的预测。
前提条件
作为前提条件,请先查看开发者的负责任AI工具
错误分析
用于衡量准确性的传统模型性能指标通常基于正确与错误预测的计算。例如,确定一个模型89%的时间是准确的,误差损失为0.001,可以被认为是良好的性能。然而,错误通常不会在您的基础数据集中均匀分布。您可能获得89%的模型准确率,但发现模型在某些数据区域的失败率高达42%。这些特定数据群体的失败模式可能导致公平性或可靠性问题。因此,了解模型表现良好或不佳的区域至关重要。模型中错误率较高的数据区域可能是重要的数据群体。
RAI仪表板上的错误分析组件通过树形可视化展示模型失败在不同群体中的分布情况。这有助于识别数据集中错误率较高的特征或区域。通过查看模型大部分错误的来源,您可以开始调查根本原因。您还可以创建数据群体以进行分析。这些数据群体有助于调试过程,以确定为什么模型在一个群体中表现良好,而在另一个群体中却出现错误。
树形图上的视觉指示器可以更快地定位问题区域。例如,树节点的红色阴影越深,错误率越高。
热图是另一种可视化功能,用户可以使用它通过一个或两个特征调查错误率,以发现整个数据集或群体中导致模型错误的因素。
使用错误分析时,您可以:
- 深入了解模型失败如何在数据集和多个输入及特征维度中分布。
- 分解总体性能指标,自动发现错误群体,以指导您的针对性缓解措施。
模型概览
评估机器学习模型的性能需要全面了解其行为。这可以通过查看多个指标(如错误率、准确率、召回率、精确度或平均绝对误差(MAE))来发现性能指标中的差异来实现。一个性能指标可能看起来很好,但另一个指标可能暴露出不准确性。此外,比较整个数据集或群体中的指标差异有助于揭示模型表现良好或不佳的区域。这对于查看模型在敏感特征(如患者种族、性别或年龄)与非敏感特征之间的表现尤为重要,以发现模型可能存在的潜在不公平性。例如,发现模型在包含敏感特征的群体中错误率更高可能揭示模型潜在的不公平性。
RAI仪表板的模型概览组件不仅有助于分析数据群体中的性能指标,还为用户提供了比较模型在不同群体中的行为的能力。
组件的基于特征的分析功能允许用户缩小特定特征内的数据子群体,以更细粒度地识别异常。例如,仪表板具有内置智能,可以自动为用户选择的特征生成群体(例如,"time_in_hospital < 3" 或 "time_in_hospital >= 7")。这使用户能够从较大的数据组中隔离特定特征,以查看它是否是模型错误结果的关键影响因素。
模型概览组件支持两类差异指标:
模型性能差异:这些指标计算所选性能指标在数据子群体之间的差异(差距)。以下是一些示例:
- 准确率差异
- 错误率差异
- 精确度差异
- 召回率差异
- 平均绝对误差(MAE)差异
选择率差异:此指标包含子群体之间选择率(有利预测)的差异。例如,贷款批准率的差异。选择率指的是每个类别中被分类为1的数据点的比例(在二元分类中)或预测值的分布(在回归中)。
数据分析
“如果你对数据施加足够的压力,它会承认任何事情” - Ronald Coase
这句话听起来极端,但确实如此,数据可以被操纵以支持任何结论。这种操纵有时可能是无意的。作为人类,我们都有偏见,而要意识到自己在数据中引入偏见通常是困难的。确保人工智能和机器学习的公平性仍然是一个复杂的挑战。
数据是传统模型性能指标的一个巨大盲点。您可能有很高的准确率,但这并不总是反映数据集中可能存在的潜在数据偏差。例如,如果一个公司员工数据集中有27%的女性担任高管职位,而73%的男性担任同一职位,那么基于该数据训练的招聘广告AI模型可能会主要针对男性观众投放高级职位广告。这种数据的不平衡使模型的预测偏向了某一性别。这揭示了模型存在性别偏见的公平性问题。
RAI仪表板上的数据分析组件有助于识别数据集中过度和不足代表的区域。它帮助用户诊断由于数据不平衡或缺乏特定数据群体代表性而引入的错误和公平性问题。这使用户能够根据预测和实际结果、错误群体以及特定特征可视化数据集。有时发现一个代表性不足的数据群体也可能揭示模型学习效果不佳,从而导致高错误率。一个具有数据偏差的模型不仅是一个公平性问题,还表明模型不够包容或可靠。
使用数据分析时,您可以:
- 通过选择不同的过滤器探索数据集统计信息,将数据切分为不同维度(也称为群体)。
- 了解数据集在不同群体和特征组中的分布。
- 确定与公平性、错误分析和因果关系相关的发现(来自其他仪表板组件)是否是数据集分布的结果。
- 决定在哪些领域收集更多数据,以缓解由于代表性问题、标签噪声、特征噪声、标签偏差等因素导致的错误。
模型可解释性
机器学习模型通常是“黑箱”。理解哪些关键数据特征驱动模型的预测可能具有挑战性。提供模型为何做出某种预测的透明性非常重要。例如,如果一个AI系统预测某位糖尿病患者有可能在30天内再次入院,它应该能够提供支持其预测的数据。提供支持数据指标可以帮助临床医生或医院做出明智的决策。此外,能够解释模型为何对个别患者做出某种预测可以确保符合健康法规的责任。当您使用机器学习模型影响人们的生活时,理解和解释模型行为的驱动因素至关重要。模型可解释性和可解释性可以帮助回答以下场景中的问题:
- 模型调试:为什么我的模型会犯这个错误?我该如何改进模型?
- 人机协作:我如何理解并信任模型的决策?
- 法规合规:我的模型是否满足法律要求?
RAI仪表板的特征重要性组件帮助您调试并全面了解模型如何做出预测。它也是机器学习专业人士和决策者解释和展示影响模型行为的特征证据的有用工具,以满足法规要求。接下来,用户可以探索全局和局部解释,验证哪些特征驱动模型的预测。全局解释列出影响模型整体预测的主要特征。局部解释显示哪些特征导致模型对个别案例的预测。评估局部解释的能力在调试或审计特定案例时也很有帮助,以更好地理解和解释模型为何做出准确或不准确的预测。
- 全局解释:例如,哪些特征影响糖尿病患者入院模型的整体行为?
- 局部解释:例如,为什么一位年龄超过60岁且有过住院记录的糖尿病患者被预测为会或不会在30天内再次入院?
在调试模型性能的过程中,特征重要性显示了特征在不同群体中的影响程度。它有助于揭示比较特征对模型错误预测的影响程度时的异常情况。特征重要性组件可以显示特征中的哪些值对模型结果产生了正面或负面影响。例如,如果模型做出了错误预测,该组件使您能够深入分析并确定哪些特征或特征值驱动了预测。这种细节不仅有助于调试,还在审计情况下提供了透明性和责任性。最后,该组件可以帮助您识别公平性问题。例如,如果种族或性别等敏感特征在驱动模型预测中具有高度影响力,这可能表明模型存在种族或性别偏见。
使用可解释性时,您可以:
- 通过了解哪些特征对预测最重要,确定您的AI系统预测的可信度。
- 通过首先理解模型并识别模型是否使用健康特征或仅仅是错误关联来调试模型。
- 发现潜在的不公平性来源,了解模型是否基于敏感特征或与敏感特征高度相关的特征进行预测。
- 通过生成局部解释来展示模型结果,建立用户对模型决策的信任。
- 完成AI系统的法规审计,以验证模型并监控模型决策对人类的影响。
结论
RAI仪表板的所有组件都是帮助您构建对社会更少伤害、更值得信赖的机器学习模型的实用工具。它有助于防止对人权的威胁;避免歧视或排除某些群体的生活机会;以及减少身体或心理伤害的风险。它还通过生成局部解释来展示模型结果,帮助建立对模型决策的信任。一些潜在的伤害可以分类为:
- 分配:例如,某一性别或种族被优待于另一性别或种族。
- 服务质量:如果您为一个特定场景训练数据,但现实情况更复杂,这会导致服务质量差。
- 刻板印象:将某一群体与预先分配的属性联系起来。
- 贬低:不公平地批评和标记某事或某人。
- 过度或不足的代表性。这个概念指的是某些群体在某些职业中未被看到,而任何继续推动这种现象的服务或功能都在助长伤害。
Azure RAI 仪表板
Azure RAI 仪表板 基于由领先学术机构和组织(包括微软)开发的开源工具构建。这些工具对数据科学家和 AI 开发者理解模型行为、发现并缓解 AI 模型中的不良问题至关重要。
🚀 挑战
为了从一开始就避免引入统计或数据偏差,我们应该:
- 确保参与系统开发的人员具有多样化的背景和观点
- 投资于反映社会多样性的数据集
- 开发更好的方法来检测和纠正偏差
思考现实生活中模型构建和使用中显而易见的不公平场景。我们还应该考虑什么?
课后测验
复习与自学
在本课中,你学习了一些将负责任 AI 融入机器学习的实用工具。
观看以下工作坊以更深入地了解相关主题:
- 负责任 AI 仪表板:由 Besmira Nushi 和 Mehrnoosh Sameki 主讲,实践中实现 RAI 的一站式解决方案
🎥 点击上方图片观看视频:负责任 AI 仪表板:实践中实现 RAI 的一站式解决方案,由 Besmira Nushi 和 Mehrnoosh Sameki 主讲
参考以下材料,了解更多关于负责任 AI 的内容以及如何构建更值得信赖的模型:
-
微软的 RAI 仪表板工具,用于调试 ML 模型:负责任 AI 工具资源
-
探索负责任 AI 工具包:Github
-
微软的 RAI 资源中心:负责任 AI 资源 – Microsoft AI
-
微软的 FATE 研究组:FATE:AI 中的公平性、问责性、透明性和伦理 - Microsoft Research
作业
免责声明:
本文档使用AI翻译服务Co-op Translator进行翻译。尽管我们努力确保准确性,但请注意,自动翻译可能包含错误或不准确之处。应以原始语言的文档作为权威来源。对于关键信息,建议使用专业人工翻译。因使用本翻译而导致的任何误解或误读,我们概不负责。