服务器 - 云主机网 - 第247页

服务器

国产大模型崛起：从企业级应用到AI创作生态的全面突破

一、国产大模型技术爆发：从“可用”到“好用”的跨越近期，国产大模型在技术能力与场景适配性上实现双重突破。以文心、通义、星火等为代表的主流模型，不仅在MMLU、C-Eval等基准测试中逼近国际领先水平，更在中文语……

2025年11月1日互联网

DeepSeek Janus：解耦视觉编码重构多模态AI新范式

引言：多模态AI的范式革命需求在人工智能迈向通用智能（AGI）的进程中，多模态理解与生成能力的统一始终是核心挑战。传统模型往往采用“耦合式”架构，将视觉、语言等模态的编码与解码过程深度绑定，导致三大痛点：……

2025年11月1日互联网

LLM大模型学习指南：从基础到进阶的必知必会

LLM大模型学习必知必会系列(一)：大模型基础知识篇一、LLM大模型的定义与核心特征 LLM（Large Language Model）大模型是指参数规模超过十亿级、通过海量文本数据训练的深度学习模型，其核心特征体现在三个维度： ……

2025年11月1日互联网

掘力计划第21期：有道子曰大模型赋能教育新范式

一、掘力计划第21期：技术赋能教育的核心命题作为教育科技领域的标杆性技术交流活动，掘力计划第21期以”AI+教育”为核心命题，聚焦大模型技术如何重构传统教育模式。本期特别邀请网易有道技术团队，首次系统性披露……

2025年11月1日互联网

AI 资讯早知道-5.14”：前沿动态与技术突破全览

一、行业动态：大模型竞争白热化，开源生态持续扩张 1.1 主流大模型更新：性能提升与场景深化5月14日，多家科技公司公布大模型最新进展。OpenAI宣布GPT-4 Turbo部分功能向企业用户开放，其多模态理解能力（如视频……

2025年11月1日互联网

ZeroQuant系列：大模型量化技术的创新突破与实践

大模型量化技术原理：ZeroQuant系列深度解析摘要在人工智能模型规模指数级增长的背景下，模型量化技术成为突破算力瓶颈的关键。微软研究院提出的ZeroQuant系列技术，通过动态量化、层间融合及硬件感知优化等创新……

2025年11月1日互联网

大模型量化：从理论到实践的降本增效之道

一、大模型量化的核心价值与驱动因素在AI大模型参数量突破万亿级后，模型部署面临三大核心挑战：内存占用激增（如GPT-3单次推理需350GB显存）、计算延迟升高（FP32精度下延迟达秒级）、硬件成本攀升（单卡A100价……

2025年11月1日互联网

王延峰：我国大模型科研组织模式亟待革新

引言近年来，随着人工智能技术的飞速发展，大模型（如GPT系列、BERT等）已成为推动AI创新与应用的核心力量。然而，我国在大模型科研领域虽取得了显著成就，但在科研组织模式上仍存在诸多不足，影响了科研效率与成……

2025年11月1日互联网

00概念科普｜解码大模型：从技术原理到产业应用

一、大模型的定义与核心特征 1.1 什么是大模型？大模型（Large Model）是基于深度学习架构构建的、参数规模达数十亿甚至万亿级别的神经网络模型。其核心特征体现在三个方面：参数规模：GPT-3拥有1750亿参数，GP……

2025年11月1日互联网

从零到一：Agent中Function Call的深度实现指南

深入理解Agent：从0实现Function Call 一、Agent与Function Call的核心概念 Agent作为自主决策的智能体，其核心能力在于通过感知环境、制定计划并执行动作来完成任务。Function Call是Agent与外部环境交互的关键机……

2025年11月1日互联网

上页 246247248 下页