请教各位佬们几个深度学习框架和分布式训练平台的问题

  1. 工业界针对大规模稀疏数据的分布式训练平台,目前流行的架构是什么?还是基于 ps 的吗?
  2. pytorch 的 ddp 在大规模稀疏数据的分布式训练任务中存在哪些问题?
  3. pytorch 相对于 tensorflow 在大模型训练中的优势有哪些?

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。