谷歌：将利用TCAV技术解决人工智能及机器学习模型偏差

2024.04.11

    谷歌首席执行官Sundar Pichai表示，谷歌正在努力使旗下的人工智能和机器学习模型更加透明，以此抵御系统的偏差。
    Pichai提及一系列人工智能增强技术以及将更多的机器学习模型放在设备上的举动，而对于开发人员和数据科学家而言他说的重点则在于TCAV。 TCAV是概念激活向量测试（Testing with Concept Activation Vectors）的英文缩写。简而言之，TCAV是一种可解释性的方法，可用于了解神经网络模型用来预测的信号。
    理论上，TCAV具有理解信号可能表现出偏差的能力，因为这些信号会强调男性是否是有别于女性，信号还会表现出其他的问题，如种族、收入和位置。计算机科学家利用TCAV就可以看到价值概念到底有多高的价值。
    偏差是人工智能里的一个重要概念，一些学者呼吁引进更多的自我监管和法例。此外，诸如IBM一类的行业参与者也在推动更大的透明度和具有监控算法层的软件，以达到了解算法是如何产生偏见的目的。而与此同时，一些企业也在向着可解释人工智能方向努力。对于谷歌来说，透明度很重要，因为谷歌的技术包括Duplex和下一代谷歌智能助理。这些工具现在为用户执行任务时的功能越来越多。模型的透明度可能意味着对谷歌技术的更多信任和使用。
    最关键的一点：透明度和防范偏差对于企业以及为我们提供大多数模型即服务的所有云提供商都至关重要。
    TCAV的使用不需要重新训练模型，TCAV做的是解剖模型即说明模型为何做出某种决定。例如，识别斑马的模型可以使用更高级别的概念来识别斑马。来看一个示例：
    Pichai表示，“要为每个人建立一个更有帮助的谷歌就意味着解决偏差问题。你需要知道模型是如何工作的，并且清楚其中可能存在偏差。为此，我们将提高模型的透明度。”
    他补充表示，谷歌的人工智能团队正在开发TCAV，这项技术可以允许模型使用更多的高级概念。TCAV的目标是将支撑模型的变量表现出来。“还有做很多的工作，但我们奉行的原则是打造适合所有人的人工智能。”Pichai表示。
    由于谷歌能够将模型的大小缩小到可以驻留在设备上，谷歌现在正朝着降低延迟及使用联合学习等技术减少数据使用并增强用户隐私的方向努力。