一、国产大模型技术爆发:从“可用”到“好用”的跨越 近期,国产大模型在技术能力与场景适配性上实现双重突破。以文心、通义、星火等为代表的主流模型,不仅在MMLU、C-Eval等基准测试中逼近国际领先水平,更在中文语……
引言:多模态AI的范式革命需求 在人工智能迈向通用智能(AGI)的进程中,多模态理解与生成能力的统一始终是核心挑战。传统模型往往采用“耦合式”架构,将视觉、语言等模态的编码与解码过程深度绑定,导致三大痛点:……
LLM大模型学习必知必会系列(一):大模型基础知识篇 一、LLM大模型的定义与核心特征 LLM(Large Language Model)大模型是指参数规模超过十亿级、通过海量文本数据训练的深度学习模型,其核心特征体现在三个维度: ……
一、掘力计划第21期:技术赋能教育的核心命题 作为教育科技领域的标杆性技术交流活动,掘力计划第21期以”AI+教育”为核心命题,聚焦大模型技术如何重构传统教育模式。本期特别邀请网易有道技术团队,首次系统性披露……
一、行业动态:大模型竞争白热化,开源生态持续扩张 1.1 主流大模型更新:性能提升与场景深化5月14日,多家科技公司公布大模型最新进展。OpenAI宣布GPT-4 Turbo部分功能向企业用户开放,其多模态理解能力(如视频……
大模型量化技术原理:ZeroQuant系列深度解析 摘要 在人工智能模型规模指数级增长的背景下,模型量化技术成为突破算力瓶颈的关键。微软研究院提出的ZeroQuant系列技术,通过动态量化、层间融合及硬件感知优化等创新……
一、大模型量化的核心价值与驱动因素 在AI大模型参数量突破万亿级后,模型部署面临三大核心挑战:内存占用激增(如GPT-3单次推理需350GB显存)、计算延迟升高(FP32精度下延迟达秒级)、硬件成本攀升(单卡A100价……
引言 近年来,随着人工智能技术的飞速发展,大模型(如GPT系列、BERT等)已成为推动AI创新与应用的核心力量。然而,我国在大模型科研领域虽取得了显著成就,但在科研组织模式上仍存在诸多不足,影响了科研效率与成……
一、大模型的定义与核心特征 1.1 什么是大模型? 大模型(Large Model)是基于深度学习架构构建的、参数规模达数十亿甚至万亿级别的神经网络模型。其核心特征体现在三个方面: 参数规模:GPT-3拥有1750亿参数,GP……
深入理解Agent:从0实现Function Call 一、Agent与Function Call的核心概念 Agent作为自主决策的智能体,其核心能力在于通过感知环境、制定计划并执行动作来完成任务。Function Call是Agent与外部环境交互的关键机……