“一个有着超大‘内存’的智能助手,可以一口气读完二十万字的小说,还会上网冲浪。”这是Kimi Chat官方对自家推出的智能助手的介绍。
3月18日,月之暗面(Moonshot AI)宣布其旗下推出的智能助手Kimi Chat在大模型长上下文窗口技术上取得新的突破,目前已经可以支持200万字超长无损上下文,并宣布开启产品内测。
此消息一出立刻引起资本市场和AI界的关注,相关话题很快登上热搜,诸多网友前往Kimi Chat官网亲自体验,一度让Kimi Chat因为过于火爆而“罢工”。而此时,距离月之暗面第一次向世人介绍Kimi Chat这款AI长文本领域的突破性成果仅过去不到半年。
半年内提升10倍,Kimi开启千亿大模型长文本时代
2023年10月9日,月之暗面向公众推出世界首个支持输入20万汉字的智能助手产品,这是月之暗面第一次在公众面前亮相,也是Kimi Chat的名字首次被公众听到。在此之后,月之暗面就渐渐淡出人们视野,只是在今年2月完成新一轮超10亿美元融资时才再度浅浅露个面。此时估计谁也未曾想到,一个月后这家AI新秀将再度爆出大惊喜,把AI长文领域赛道竞争的激烈程度“自我内卷”到难以企及的新高度。
相比于此前的20万字长文本上限,全新的Kimi智能助手支持文本上限的长度直接提升到原先10倍,而更大容量的长上下文处理能力无疑将帮助Kimi用户解锁更多新的使用场景,包括长篇文本的翻译和理解、辅助分析法律问题、一次性整理几十张发票、快速理解API开发文档等。
而除了长文本处理能力大幅提升之外,新的Kimi同样还强化了自身的上下文窗口和无损记忆功能以及多语言支持优势,这使得Kimi在联网搜索与信息搜集、数据处理、编写代码和模拟对话等多种使用场景中同样可以表现出色,也意味着国产AI在文本领域上或已超过海外顶尖水平。
“过去要 10000 小时才能成为专家的领域,现在只需要 10 分钟,Kimi就能接近任何一个新领域的初级专家水平。用户可以跟 Kimi 探讨专业领域的问题,让Kimi帮助自己练习专业技能,或者启发新的想法。”月之暗面方面为此举例道:用户可以上传一份完整的近百万字中医诊疗手册让Kimi阅读学习,之后Kimi就可以针对用户提出的问题给出专业诊疗建议。
资本市场望风而动,新概念股流行
有趣的是,Kimi升级的消息最先震动的并非AI圈,Sora出世以来对AI市场风向敏感的资本市场反应迅速,抢先一步开始了狂欢,推动Kimi很快成为资本市场的新宠。
首先开始大涨的,是素有A股“妖王”之称的九安医疗。自3月19日起,九安医疗股价突然垂直起飞,从当日开盘的41.96元/股,在4个交易日内一度涨至最高54.98元/股,而原因仅仅是因为在去年8月时,九安医疗曾经投资过月之暗面。
3月20日开始,与Kimi相关的概念股终于集体爆发,“kimi概念股”成为A股市场上冉冉升起的一个全新的概念,多家上市公司因此集体收益,其中包括华策影视、掌阅科技、中广天择等。根据一周牛熊股发布的“本周涨幅最大个股TOP10”,3月18日到3月22日,华策影视股价一周大涨95.41%,堪称“最强Kimi概念股”。
但Kimi概念股高歌猛进的势头并没能持续太久,多家股市在短期骤涨后就很快开始降温。25日开始,中广天择收盘跌停,福昕软件、华策影视双双大跌,跌幅分别为15.01%、12.93%;广宇软件、深信服、易点天下跌幅均超10%,掌阅科技更是险些在短期内上演了一出“天地板”。开盘以来,掌阅科技一度实现10天6板,但很快股价就大幅剧震,收盘跌近6%。
“Kimi延续了人工智能领域的火热,因能与智能车等诸多产业结合,所以市场天花板很高。加上政策扶持,受资金青睐在意料之中。”科技分析师赵松解释道:“该板块的注意力一般聚焦在资金面和企业估值抬升上。券商炒热概念然后退出赚钱,导致该板块短期内出现较大的波动性。”
旧赛道新高度,AI长文本内卷升级
事实上,Kimi主打的长文本赛道本身并不算是目前AI领域的“潮流”赛道,甚至在Sora推出之前,业内就有声音认为单一的大语言模型必将被淘汰,多模态转型才是未来趋势。但就是在这样的背景下,月之暗面依然将长文本大语言模型内卷到一个所有人都始料未及的新高度,让AI长文本再度成为一时热点。
无论走哪个赛道,只要做到业内顶尖就不怕没有市场。随着Chat GPT发布,AI文本分析和生成就已经不再是什么稀奇事,日常的工作学习和生活中,不少人也已经逐渐习惯于利用AI助手处理文本,但自始至终,由于目前市面上主流的AI大模型产品在promot的输入上都存在字数限制,应用场景还是相当局限。
比如GPT-3.5上下文输入长度约在1.6万token(token即模型输入和输出的基本单位),GPT-4在3.2万token。把token量化成人类语言的话,3.2万token的GPT-4达到了阅读一篇短篇小说的程度,但并不支持阅读长篇小说。
相比于同赛道的其他文生文大语言模型应用,Kimi自诞生起的核心竞争力就聚焦于长文本分析联网搜索、文档处理等功能,在处理分析长文本材料,如厚重的学术文献、古籍之类,Kimi的性能远超其他模型。因此Kimi的出现和突破可以说填补了目前AI文本处理方面的市场空白。
有用户实测了Kimi在长文本阅读上的表现,发现其在理解超长文本,比如小说和长篇文件上确实具有独到优势。输入一本长达70多万字的《红楼梦》,Kimi只用耗时数秒就能给出一篇漂亮的总结报告。
但是旧赛道的内卷并没有被Kimi终结,反而很快卷出新高度。在Kimi宣布升级后,阿里和360在几日后就相继宣布自家AI助手将免费开放长文本功能。阿里旗下国产大语言模型通义千问预告即将免费开放1000万字的长文档处理功能,如果顺利问世就会成为全球文档处理容量第一的AI应用。360更是在23号直接宣布其AI大模型智脑正式开启内测500万字长文本处理功能,并入驻360AI 浏览器。
Kimi让AI界再度聚焦大语言模型领域的蓝海商机,一批资本开始回流。“随着竞争对手们相继发力长文本处理,Kimi的差异化优势或将不会太突出。如果大家都宣布免费开放,企业们的盈利问题将日益严峻。”赵松表示。
无损长文——通往通用人工智能的钥匙
通用人工智能(General Artificial Intelligence),是指具有高效的学习和泛化能力、能够根据所处的复杂动态环境自主产生并完成任务的通用人工智能体,具备自主的感知、认知、决策、学习、执行和社会协作等能力,且符合人类情感、伦理与道德观念。换言之,通用人工智能就是具有真正“智能”的人工智能,是几个世纪以来人工智能努力发展的最终方向。
即便当下现有的人工智能已经足以突破人类的固有想象,但实际上依然都停留在弱人工智能阶段,离真正的人工智能相差甚远。而无损的长上下文,就将会是走向通用人工智能的一个关键的基础技术。月之暗面创始人杨植麟表示:“历史上所有的模型架构演进,本质上都是在提升有效的、无损的上下文长度。上下文长度可能存在摩尔定律,但需要同时优化长度和无损压缩水平两个指标,才是有意义的规模化。”
时间回溯到2022年底,AI界的“破壁人”ChatGPT问世,相比以往AI产品,这款不仅可以流畅地与人类进行对话,还能够在这个过程中完成多项自然语言处理任务的大语言模型彻底打破人工智能局限于某一特定领域的桎梏,让人工智能摘下了“人工智障”的标签,为通用人工智能带来了曙光。而今天,Kimi揭开AI大模型在长文本领域的高速发展序幕,强大的长文本处理能力必将使AI在知识获取、专业文档分析以及语义理解等更加复杂的任务上产生巨大的实用价值,拓展AI应用前景。