OpenAI发布具有推理能力的人工智能模型o1

发布时间:2024 年 9 月 13 日 分类:新闻资讯 浏览量:26

2024年9月13日消息,近日,OpenAI发布了一款具有强大推理能力的人工智能模型o1,引起了广泛关注。

据悉,o1采用了全新的优化算法和专门定制的新训练数据集进行训练,数据集中包含“推理数据”和专门的科学文献。与之前的GPT模型训练方法不同,o1采用“强化学习”方式,通过奖励和惩罚来教导模型自行解决问题,并通过“思路链”处理用户查询,给出总结摘要版,类似人类处理问题的方式。

o1模型具有诸多优势。在推理能力方面表现突出,对于复杂的推理任务是重大进步,代表了人工智能能力的新水平。在物理、化学和生物等学科的具有挑战性的基准测试中表现与博士生相当;在国际奥数竞赛的资格考试中正确率高达83%,远高于GPT-4o的13%;在Codeforces在线编程竞赛中的成绩也高达89百分位。同时,安全性也得到提升,比之前模型更能遵守安全准则,抵抗产生有害内容。在最严格的“越狱测试”标准下,GPT-4o得分仅为22分,而o1预览版的分数高达84。此外,该模型还能自我核实答案正确性,在给出答案前会先“思考”,有效进行事实核查,识别和修正自身答案中的错误。

然而,作为初始版本,o1预览版也存在一些不足。它暂时只是“纯文字版”,无法浏览网页信息以及上传文件和图片,不具备ChatGPT的许多使用功能。在很多领域的能力不如GPT-4o,在关于世界的事实知识方面表现不佳;有的用例下推理能力较慢,可能需要更长时间来回答问题。同时,缺乏针对特定文档进行推理或从网络收集实时信息的能力,且容易产生“幻觉”,即自信地编造答案,很少承认不知道问题的答案。

OpenAI推出的o1模型无疑是人工智能领域的一个重要进展,有望在科学、编程、数学等领域为用户提供更强大的支持。但未来仍需不断改进和完善,以更好地满足用户的需求。