横向联邦学习,也称为按样本划分的联邦学习(Sample-Partitioned Federated Learning 或 Example-Partitioned Federated Learning),是一种分布式机器学习技术,用于解决数据隐私和集中化数据处理的问题。在横向联邦学习中,各个参与方的数据集具有相同的特征空间但不同的样本空间。这意味着虽然不同参与方的数据可能来自不同的来源或具有不同的特征,但它们在特征层面上是相似的,而在样本层面上则不同。
这种学习方法的典型应用场景包括不同机构之间的合作,例如不同地区的银行,它们需要学习或预测的特征是类似的,但用户和样本是不同的。通过横向联邦学习,这些机构可以联合起来构建更准确的风险控制模型,同时保持数据的隐私和安全。
横向联邦学习的一般过程包括以下步骤:
1. 中心节点建立一个基本的全局模型,并将模型的结构和参数告知参与方。
2. 参与方利用本地数据训练模型,并将训练好的模型参数(加密后)返回给中心节点。
3. 中心节点聚合各参与方返回的参数,整合形成更精准的全局模型,并将其分发给各参与方。
这种学习方法的优势在于能够有效利用分散在不同参与方的数据,通过在本地训练模型并共享模型更新来实现全局模型的优化,同时减少了对中心化数据中心的依赖,增强了数据隐私保护。