服务器 - 云主机网 - 第242页

服务器

百模大战”下AI大模型竞逐：谁将领跑未来？（附国内大模型列表）

引言：AI大模型的“春秋战国”时代自2023年ChatGPT引爆全球AI热潮以来，国内AI大模型领域迅速进入“百模大战”阶段。据不完全统计，国内已有超过100款公开或商用的大模型，涵盖通用基础模型、垂直领域模型、开源/闭源……

2025年11月1日互联网

Llama3.1 原模型与中文微调模型实战效果深度解析

一、Llama3.1 原模型核心能力评估 1.1 基础语言处理能力 Llama3.1 原模型在英文语境下展现出强大的文本生成与理解能力。在标准测试集（如LAMBADA、PIQA）中，其困惑度（Perplexity）指标达到行业领先水平，尤其在……

2025年11月1日互联网

CodeFuse新开源模型：AI代码生成领域的破局者

近日，AI代码生成领域迎来里程碑事件：由某知名团队研发的CodeFuse新开源模型在Big Code国际评测中以绝对优势登顶榜首，成为全球首个在该权威基准测试中超越人类平均水平的代码生成模型。这一突破不仅标志着AI辅助……

2025年11月1日互联网

DeepSeek发布最强开源数学定理证明模型：重塑自动化证明新范式

一、技术突破：重新定义自动化证明的边界 DeepSeek-Proof的核心创新在于其多阶段推理架构，该架构将数学证明过程分解为”假设生成-路径探索-验证优化”三个独立模块，通过动态权重分配实现全局最优解搜索。相较于传……

2025年11月1日互联网

MFTCoder v0.3.0 发布：模型生态、训练优化与分布式扩展全面升级

一、版本升级背景：AI 工程化需求驱动技术迭代在 AI 模型规模指数级增长（参数从十亿级迈向万亿级）的背景下，开发者面临三大核心挑战：模型适配成本高：主流框架（如 Hugging Face Transformers）的模型实现……

2025年11月1日互联网

2024年AI创作者签约计划：揭晓与深度解析

📢 2024年人工智能创作者签约计划开奖公示一、计划背景与目标：构建AI内容生态新范式 2024年人工智能创作者签约计划（以下简称“计划”）由多家科技企业与行业协会联合发起，旨在通过资金支持、技术赋能与流量扶持……

2025年11月1日互联网

MFTCoder赋能：CodeFuse-DeepSeek-33B登顶Big Code的技术解码

一、Big Code竞赛背景与技术挑战 Big Code作为全球代码智能领域的权威基准测试，涵盖代码补全、缺陷修复、跨语言迁移等12项核心任务，其数据集覆盖GitHub、Stack Overflow等平台超500万条代码样本。2023年最新榜单……

2025年11月1日互联网

AI赋能开发：在VSCode中利用大模型AI提升编码效率

引言：AI与开发工具的深度融合在软件开发领域，效率与质量始终是核心追求。随着大模型AI（如GPT-4、CodeLlama等）的崛起，开发者工具链正经历革命性变革。VSCode作为全球最流行的代码编辑器，通过插件生态与AI结……

2025年11月1日互联网

大模型轻量化实践路径：从技术到落地的系统性探索

一、大模型轻量化的核心驱动力在AI技术从实验室走向产业化的过程中，大模型轻量化已成为关键突破口。以GPT-3为例，其1750亿参数的规模导致单次推理需消耗约350GB显存，直接限制了在移动端、IoT设备等资源受限场景……

2025年11月1日互联网

DeepSeek-Coder-V2：中国代码生成技术的里程碑式跨越

一、技术突破：从参数规模到生成质量的全面升级 DeepSeek-Coder-V2的核心突破体现在其150亿参数规模的混合专家架构（MoE）上。相较于前代模型，其参数规模提升300%，但通过动态路由机制，实际推理时仅激活约20%的……

2025年11月1日互联网

上页 241242243 下页