一月:大模型架构迎来范式革命 2025年初,某主流云服务商发布的”动态注意力网络”(Dynamic Attention Network, DAN)架构引发学术界热议。该架构通过引入可变长的注意力窗口机制,在长文本处理任务中将推理速度提……