首页 > 资讯列表 > 科技资讯 >> 业界动态

OpenAI全面开放o1系列模型API,赋能开发者构建更先进AI应用

业界动态 2024-12-18 08:23:38 转载来源: 网易科技报道 北京

OpenAI全面开放o1系列模型API,赋能开发者构建更先进AI应用12月18日,OpenAI在其为期12天的假日发布会的第九天,正式宣布其最先进的o1系列模型已通过应用程序接口(API)全面开放给第三方开发者。此举标志着开发者在构建先进人工智能应用方面迈出了关键一步,也为开发者提供了将OpenAI顶尖技术无缝集成到现有企业级应用或面向消费者的工作流程中的便捷途径

OpenAI全面开放o1系列模型API赋能开发者构建更先进AI应用

12月18日,OpenAI在其为期12天的假日发布会的第九天,正式宣布其最先进的o1系列模型已通过应用程序接口(API)全面开放给第三方开发者。此举标志着开发者在构建先进人工智能应用方面迈出了关键一步,也为开发者提供了将OpenAI顶尖技术无缝集成到现有企业级应用或面向消费者的工作流程中的便捷途径。

o1系列模型,包括o1和o1 mini,于2024年9月首次亮相,是OpenAI“新模型家族”的首个成员。它代表着对GPT系列大语言模型(LLM)的重大突破,引入了全新的“推理”能力。与传统的LLM相比,o1系列模型虽然响应时间略长,但却能够在生成答案时进行自我校验,有效确保答案的准确性,从而显著减少了“幻觉”现象的出现。OpenAI此前曾表示,o1模型能够处理更复杂的任务,甚至包括博士级别的难题,而实际应用中的反馈也充分印证了这一点。

在API正式发布之前,开发者已可以通过o1预览版构建各种应用,例如“博士导师”或“实验室助手”。如今,正式上线的生产版o1模型(版本号:o1-2024-12-17)在性能上得到了显著提升,延迟更低,并新增了多项功能,极大地简化了模型在实际场景中的集成和应用。大约两周半前,OpenAI已通过ChatGPT Plus和ChatGPT Pro计划向消费者开放了o1模型,并增加了对用户上传图像及文件的分析和响应功能。

新版o1模型在复杂且多步推理任务中表现出色。与之前的o1-preview版本相比,该版本在准确性、效率和灵活性方面均实现了显著提升。OpenAI提供的多项基准测试结果显示,o1模型取得了突破性进展,涵盖编码、数学和视觉推理等多个领域。例如,在SWE-bench Verified测试(用于评估模型解决实际软件问题的能力)中,o1的得分从41.3提升至48.9;在数学领域的AIME测试中,得分从42大幅跃升至79.2。这些改进使得o1模型成为优化客户支持、提升物流管理效率或解决复杂分析问题等场景中的理想工具。

为了进一步提升开发效率和应用灵活性,OpenAI为开发者提供了诸多新功能:

OpenAI全面开放o1系列模型API,赋能开发者构建更先进AI应用

  • 结构化输出:允许生成符合自定义格式(如JSON架构)的响应,确保与外部系统交互时保持结果一致性,方便数据处理和集成。
  • 函数调用:简化了模型与API及数据库的连接流程,使开发者能够更便捷地访问和利用外部资源。
  • 视觉推理:使模型能够处理视觉输入,拓展了其在制造、科学研究和编程等领域的应用场景,为开发者提供了更广阔的想象空间。

此外,开发者还可以通过新增的`reasoning_effort`参数对o1模型进行微调。该参数可平衡任务的性能和响应时间,控制模型在任务处理时所投入的计算时间,让开发者可以根据实际需求进行灵活调整。

除了o1系列模型的API开放,OpenAI还在此次发布会上公布了对Realtime API的重大更新,旨在支持低延迟、自然流畅的语音交互体验,这对于语音助手、实时翻译工具和虚拟导师等应用至关重要。

此次Realtime API更新包含以下几个关键方面:

  • WebRTC集成:为开发语音应用提供了直接支持,包括音频流、噪声抑制和网络拥塞控制等功能,即使在网络条件不稳定的情况下,开发者也能轻松实现实时功能集成,确保应用的稳定性和可靠性。
  • 价格下调:OpenAI显著降低了Realtime API的成本,例如GPT-4音频价格下调60%,每100万输入Token费用降至40美元,输出Token费用降至80美元;缓存音频输入成本降低87.5%,定价为每100万输入Token 2.5美元;GPT-4o mini作为更小、更经济高效的模型,每100万输入Token费用仅为10美元,输出Token费用为20美元。GPT-4o mini的文本Token价格也大幅降低,输入Token的起始价格为0.60美元,输出Token的起始价格为2.40美元。
  • 更高的控制权:OpenAI赋予开发者对Realtime API更高的控制权,例如并发带外响应,允许后台任务(如内容审核)在不影响用户体验的情况下运行;上下文定制,开发者可以根据对话内容定制输入上下文,并精确控制语音响应的触发时机,以实现更准确、流畅的交互体验。这些改进将使开发者能够构建更加高效和个性化的语音应用。

除了上述两个主要更新,OpenAI还推出了另一个重要功能——偏好微调。这是一种基于用户和开发者偏好来定制模型的新方法。不同于传统的监督式微调依赖精确的输入-输出对,偏好微调采用成对比较的方式,引导模型识别并生成更符合用户偏好的响应。这种方法在处理主观性任务时尤其高效,比如摘要生成、创造性写作,或在语气和风格至关重要的场景中。

与合作伙伴RogoAI的早期测试显示了令人鼓舞的结果。RogoAI为金融分析师开发智能助手,测试表明偏好微调在处理复杂、分布外查询时,相较于传统微调方法,显著提升了模型的表现,将任务准确率提高了5%以上。目前,该功能已应用于GPT-4o-2024-08-06和GPT-4o-mini-2024-07-18版本,并计划于明年初拓展到更多新模型上。

为了进一步简化模型集成,OpenAI正在扩展其官方SDK产品线,推出Go和Java语言的测试版SDK。这些新SDK与现有的Python、Node.js和.NET库一同,为开发者提供更多编程环境的支持,使与OpenAI模型的交互更加便捷。

  • Go SDK:特别适用于构建可扩展的后端系统,提供高性能和灵活的开发能力。
  • Java SDK:专为企业级应用设计,凭借强类型支持和成熟生态系统,适配复杂且稳定性要求高的项目。

通过这些更新,OpenAI为开发者提供了更丰富的工具集,帮助他们构建先进、高度可定制的人工智能应用程序。无论是o1模型在复杂推理任务中的增强,Realtime API的优化,还是偏好微调的推出以及新SDK的发布,OpenAI的最新产品旨在提供更强大的性能和更高的成本效益,助企业不断拓展人工智能技术的应用边界。

标签: OpenAI 全面 开放 o1 系列 模型 API 赋能 开发者


声明:本文内容来源自网络,文字、图片等素材版权属于原作者,平台转载素材出于传递更多信息,文章内容仅供参考与学习,切勿作为商业目的使用。如果侵害了您的合法权益,请您及时与我们联系,我们会在第一时间进行处理!我们尊重版权,也致力于保护版权,站搜网感谢您的分享!

站长搜索

http://www.adminso.com

Copyright @ 2007~2024 All Rights Reserved.

Powered By 站长搜索

打开手机扫描上面的二维码打开手机版


使用手机软件扫描微信二维码

关注我们可获取更多热点资讯

站长搜索目录系统技术支持