DeepSeek-V2开源发布:236B参数模型以高效训练刷新AI性能标杆
中国AI初创公司DeepSeek近日开源DeepSeek-V2模型,总参数达236B,却仅需309B训练令牌,在数学推理等任务上超越Llama3。HuggingFace下载量破纪录,X平台中文圈互动超20万,凸显其高性价比与中国AI追赶势头。
中国AI初创公司DeepSeek近日开源DeepSeek-V2模型,总参数达236B,却仅需309B训练令牌,在数学推理等任务上超越Llama3。HuggingFace下载量破纪录,X平台中文圈互动超20万,凸显其高性价比与中国AI追赶势头。
OpenAI近日发布的o1-preview模型在数学和编码基准测试中大幅超越GPT-4o,ARC-AGI得分高达83%,引发热议。其‘思考链’机制标志AI从生成向推理转型,开发者分享复杂问题求解案例,X平台互动超50万,业内讨论AGI路径加速。
中国AI公司DeepSeek推出V2模型,在中文数学推理任务中超越GPT-4o,总参数236B却仅激活21B,高效开源架构引爆国内X平台讨论,互动超5万次,彰显中资AI追赶全球势头。