DeepSeek技术解析:参数量、激活参数与预训练token量全解