生成式 AI 的发展对数据治理和隐私保护提出了更高的要求。关于生成式 AI 数据治理的讨论主要集中在以下两点:1)AI 生成内容的版权界定:指由 AI 生成的文字、图片等内容是否受到版权保护,以及版权应当归属于用户、模型提供商、训练数据提供者等哪一方。2)模型训练数据的版权规定:指 OpenAI、StabilityAI 等模型供应商在训练基础模型时采用的数据集是否受到版权保护,模型供应商应该以怎样的方式获得训练数据集的版权。随着国内外 AI 数据治理相关法律法规的完善,对数据安全和隐私保护的要求也会逐渐提高。