存储绩并对 和 形成了全面超越。在数据库的 Q 测试中其表现也与通用模型 十分接近。 在其他一些编程语言测试中和通用版 各有胜负但平均成绩小幅超过了 且相对于 的优势明显。在 、J 和 J 中的 评分接近或超过 平均成绩为 超过了参数量更大的 。
长上下文窗口:支持 的上下文
窗口相比其他模型(通常为 、 或 )大幅增加。 代码编辑 Rang 数据 能力:支持 (—)可以对现有代码进行填充补全。 使用方式多样: 已将模型权重上传到了 可供有条件的用户自行下载部署。此外、、 等大模型框架以及 自家的开发者平台 已支持使用 。它还提供了专属 其中 正在进行免费测试 则按 收费。用户也可通过 的在线对话平台 直接使用网页进行对话。同时第三方插件 、 支持通过在 和 J 系列 中使用 。 不过 使用了全新的“非生产
可协议 按照规定仅可用于研究目的不能进 尼西亚人现在已经转向使用 行商用即使仅将其用于公司内部事务也不被允许。 表示后续会继续发布基于 协议的其他模型。 八、 是 公司于 年 月 日发布的 模型。它是 系列模型中的首个版本。 以下是 的一些主要特点: 性能优势:在阅读、编码、数学和视觉等主要 基准测试中其能力不仅超过了 也超越了 此前的旗舰模型 。在研究生水平推理(Q)、编码能力()、文本推理()等方面表现出色成绩优于 -但在数学问题解决能力上稍逊
于后者它能够更好地理解指
令之间的细微差别有更强的幽默能 ADB 目录 力还为包括 Q(研究生水平推理)、(本科生水平知识)与 等基准测试设立了全新的行业标准。根据内部代理编码评估其解决了的问题远超 的。 视觉能力:作为一款多模态大模型其视觉能
力有较大提升。它可以更准确地解释图表和图形能在带有扭曲和视觉伪像等“不完美图像中顺利完成文本转录任务在所有标准视觉基准测试中的平均表现比 高出 。它擅长解释和分析视觉数据例如理解复杂的图表、图形和图解分析信息图表和科学可视化解释场景中的空间关系等;可以无缝融合图像和文本的信息;能够准确识别和描述图像中的物体;支持视
觉问答可根据视觉分析提供答案;能利用视觉信息来协助解决问题;可以提供有关艺术风格、设计元素和视觉美学的见解;展示了识别和转录手写文本的改进能力;可以从视觉呈现的数据中提取相关信息还能处理多种文本样式以及转录多种语言的文本并理解图像中文本的上下文在转录结构化文本时通常可以保留或描述原始格式。 运行速度与成本:运行速度是 的两倍而价格仅为后者的五分之一。其输入价格为 美元百万 输出价格为 美元百万 上下文窗