cache checkpoint rdd.persist(StorageLevel.DISK_ONLY) 使用场景 会被重复使用的(但不能太大) 运算时间很长或运算量太大才能得到的 RDD,computing chain 过长或依赖其他 RDD 很多的 ……