先做个广告:如需代注册帐号或代充值Chatgpt Plus会员,请添加站长客服微信:pingzi7749
OpenAI于7月18日正式推出了 GPT-4o mini,这是 OpenAI 迄今为止最具成本效益的小型模型。OpenAI 预计,GPT-4o mini 将显著扩大 AI 应用的范围,使智能技术变得更加经济实惠。
性能卓越 成本低廉
GPT-4o mini 在 MMLU 中得分为 82%,在 LMSYS 排行榜中的对话首选项中表现优于 GPT-4。这款模型的每百万输入令牌仅需 0.15 美元,每百万输出令牌为 0.60 美元,比之前的前沿模型便宜了一个数量级,比 GPT-3.5 Turbo 便宜超过 60%。
多任务处理 提高效率
GPT-4o mini 具备低成本和低延迟的优势,在多种任务,如撰写实时文本响应(如客户支持聊天机器人)、处理大量上下文输入(如完整代码库或对话历史)以及串行或并行多模型调用(如调用多个 API)中表现卓越。
模型特性
目前,GPT-4o mini 在 API 中支持文本和视觉功能,未来将支持文本、图像、视频和音频输入输出。该模型拥有 128K 令牌的上下文窗口,每次请求支持最多 16K 输出令牌,并具备到 2023 年 10 月的知识。同时,GPT-4o mini 的改良标记器使处理非英语文本更加经济高效。
优异表现
GPT-4o mini 超越了 GPT-3.5 Turbo 和其他小型模型,在学术基准测试中表现出色。不仅在文本智能和多模态推理上表现突出,还支持与 GPT-4o 相同语言的广泛应用。该模型在函数调用方面的强大表现,使开发者能构建提取数据或与外部系统交互的应用。同时,GPT-4o mini 在长上下文处理方面也优于 GPT-3.5 Turbo。
关键基准评测结果
推理任务: 在文本和视觉推理任务中,GPT-4o mini 得分为 82.0%,而 Gemini Flash 得分为 77.9%,Claude Haiku 为 73.8%。
数学及编码能力: 在 MGSM 中,GPT-4o mini 的数学推理得分为 87.0%,超过了 Gemini Flash(75.5%)和 Claude Haiku(71.7%)。在人类评估中,其编码得分为 87.2%,相比之下,Gemini Flash 为 71.5%,Claude Haiku 为 75.9%。
内置安全措施
从预训练到后期训练,GPT-4o mini 都内置了严格的安全措施。在预训练中,OpenAI 过滤掉了不希望模型学习或输出的信息,如仇恨言论、成人内容和垃圾信息。在后期训练中,使用人类反馈强化学习(RLHF)等技术,使模型行为与 OpenAI 的政策保持一致,提高响应的准确性和可靠性。
本文链接:https://www.vipbxr.vip/GPT5_367.html
GPTs机器人GPTs机器人AI机器人GPT-4.5 TurboGPT4.5GPT4.5官网GPT4.5发布GPT4.5网址GPT4.5网页版
网友评论