摘要:中国新推出的人工智能应用程序DeepSeek以惊人的速度震撼了科技行业、市场以及美国在人工智能领域的优越感。
最近DeepSeek横空出世,给了全球科技界“亿点点”震撼。短短几日,DeepSeek应用就超越ChatGPT,登顶苹果美国地区应用商店免费APP下载排行榜。应用上线20天,日活已迅速突破2000万。
DeepSeek出自深度求索公司。其成立于2023年,由知名量化资管巨头幻方量化创立,专注研究世界领先的通用人工智能底层模型与技术。
2024年1月5日,DeepSeek LLM发布,这是深度求索的第一个大模型。2024年12月26日,DeepSeek正式上线全新系列模型DeepSeek-V3首个版本并同步开源。
拥有惊人的6710亿参数、14.8万亿高质量token的DeepSeek-V3,不仅在推理速度上大幅提升,更以557.6万美元的训练成本和280万个GPU小时的计算需求,成功实现了与现有顶尖模型的竞争。在目前大模型主流榜单中,DeepSeek-V3 在开源模型中位列榜首,与世界上最先进的闭源模型不分伯仲。
而真正让 DeepSeek在全球崭露头角的是,今年1月20日发布的开源大模型DeepSeek-R1。R1在数学、代码、自然语言推理等任务上,比肩OpenAI o1正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。这不仅降低了企业和开发者的使用成本,还大大提高了AI技术的普及度。
此外,在商业化落地方面,DeepSeek-R1展现出极具竞争力的成本优势。其API服务采用差异化定价策略:输入tokens每百万收费1元(缓存命中)或4元(缓存未命中),输出tokens每百万仅需16元,显著低于OpenAI o1每百万输入tokens 15美元及输出tokens 60美元的水平,极大降低了AI技术的使用门槛。
凭借高性能、低成本、开放性三大优势,国产开源大模型DeepSeek迅速破圈,吸引了海内外巨头纷纷接入。
1月31日,英伟达、亚马逊和微软三家美国科技巨头在同一天宣布接入先进大语言模型DeepSeek-R1。
2月,华为云、京东云、联通云、天翼云等国内主流云平台也争先上线R1大模型。目前京东云已正式上线DeepSeek-R1和DeepSeek-V3模型,支持公有云在线部署、专混私有化实例部署两种模式,供用户按需部署,快速调用。
在芯片领域,国内GPU厂商加速与DeepSeek模型对接并完成适配。2月5日,华为官方表示,DeepSeek系列新模型正式上线昇腾社区。
DeepSeek选择开源,为全球人工智能领域提供了高性能、低成本的模型范例。随着越来越多的厂商接入,围绕DeepSeek的产业生态正在形成,云平台提供计算资源和模型部署服务,芯片厂商提供算力支持,应用厂商拓展应用场景,实现相互协作相互促进。
英国《卫报》网站日前刊文指出,中国人工智能(AI)企业深度求索(DeepSeek)打破了美国对AI的话语权垄断。BBC则报道称,中国新推出的人工智能应用程序DeepSeek以惊人的速度震撼了科技行业、市场以及美国在人工智能领域的优越感。
目前DeepSeek正在全力加快AI智能生态的发展和丰富,加快从工具到生态的跃进。未来,随着技术的不断迭代和产业生态的日益完善,DeepSeek有望在全球AI领域发挥更加重要的作用,引领人工智能技术的创新与应用。