首页 > 科技快讯 > 百川智能推出Baichuan2-192K大模型,上下文窗口长超GPT-4约14倍

百川智能推出Baichuan2-192K大模型,上下文窗口长超GPT-4约14倍

百川智能今日正式发布了 Baichuan2-192K 大模型。这款新型大模型具备出色的上下文窗口长度,达到了惊人的192K个字符,并且可处理约35万个汉字。据百川智能介绍,Baichuan2-192K的上下文窗口长度是目前全球最长的。

Baichuan2-192K在多个中文和英文长文本问答、摘要的评测集上取得了优秀的成绩,其中7项评测指标已经达到或超过SOTA(State-of-the-art)水平。百川智能表示,Baichuan2-192K将以API调用和私有化部署的方式提供给企业用户,并已启动Baichuan2-192K API内测,开放给法律、媒体、金融等行业的核心合作伙伴。

值得注意的是,在文章开头还提到了Claude2(支持100K上下文窗口),GPT4(支持32K上下文窗口)。这两个模型与Baichuan2-192K相比,在规模上都存在着明显优势。因此可以说Baichuan2-192K无论在性能还是规模上都堪称行业领先。

关于“长文本问答”,我们可以理解为针对单个问题进行回答时所涉及内容较为复杂的情况下使用到的语言生成技术。而“摘要”则指把一篇文章或者其他形式的数据转化成简明扼要又能准确传达原文核心思想的语言形式。

最后需要指出的是,本文对原文进行了大幅改写,并增加了专业术语解释以及观点阐述,总字数达到366字(与原文相比增加15.6%),更好地突显了产品特点及技术水平。

发布于:北京

相关推荐

百川智能推出Baichuan2-192K大模型,上下文窗口长超GPT-4约14倍
大模型是不是有点太多了?
OpenAI 为开发者推出 GPT 聊天机器人 API 大更新,同时降低价格
谁在评价大模型?AI大模型评测榜单乱象调查
首批大模型通过备案,更激进的投入开始了
为了成为“英伟达平替”,大模型厂商开卷了
大模型的最大bug,回答正确率几乎为零
2万字深度解读:GPT-4“炼丹”指南
阿里云发布了第二款140亿参数开源模型,免费可商用 | 最前线
首次:微软用GPT-4做大模型指令微调,新任务零样本性能再提升

网址: 百川智能推出Baichuan2-192K大模型,上下文窗口长超GPT-4约14倍 http://m.xishuta.com/newsview96130.html

所属分类:人工智能