幻方量化旗下模型DeepSeek上线V3版本

12月26日,幻方量化全新系列模型DeepSeek-V3首个版本上线并同步开源,API服务已同步更新,接口配置无需改动。当前版本的DeepSeek-V3暂不支持多模态输入输出。据介绍,DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8Ttoken上进行了预训练,其多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

编辑/李雅
本平台发布/转载的内容仅用于信息分享,不代表我司对外的任何意见、建议或保证,我们倡导尊重与保护知识产权,如发现本站文章存在版权问题,烦请将版权疑问、授权证明、版权证明、联系方式等,发邮件至info@tonews.cn,我们将第一时间核实、处理。同时,欢迎各方媒体、机构转载和引用,但要严格注明来源:今日商讯。

您可能感兴趣的文章