一、工具核心架构与功能解析 video-analyzer通过融合视觉大模型与语音识别技术,构建了完整的视频内容解析体系。其技术架构包含三大核心模块: 视觉分析引擎:采用110亿参数的视觉大模型,支持每秒15帧的实时关键……