OpenAI推出新的ChatGPT代理用于“深度研究”

夸夸软件库 - 免费软件下载|电脑手机软件|游戏课程教程

OpenAI 宣布推出新的 AI “代理”——ChatGPT 深度研究功能,旨在帮助人们在 ChatGPT 平台进行深入复杂研究。此功能面向特定领域高强度知识工作者及有仔细研究购买需求的人。目前先向 ChatGPT Pro 用户提供,每月限 100 次查询,后续支持 Plus、Team 和企业用户。使用时在撰写器中选择 “深度研究” 并输入查询,可附加文件或电子表格,目前输出仅为文本,未来将添加图像、数据可视化等。该功能可能存在精度问题,OpenAI 采取了一些缓解措施,如完全记录输出并带有清晰引用和思考总结,还使用特殊版本的 o3 模型进行强化学习训练,经过 “人类的最后考试” 测试,准确率为 26.6%,但仍有局限性。谷歌在不到两个月前也宣布了类似功能。。

图片[1]-OpenAI推出新的ChatGPT代理用于“深度研究”-夸夸软件库

基本上,ChatGPT 深度研究适用于那些你不仅想要快速答案或摘要,还需要仔细考虑来自多个网站和其他来源的信息的场景。

OpenAI 表示,今天将向 ChatGPT Pro 用户提供深度研究功能,每月限制 100 次查询,接下来将支持 Plus 和 Team 用户,随后是企业用户。(OpenAI 表示,目标是在大约一个月后推出 Plus 版本,付费用户的查询限制应该会“显著提高”。)这是一个地理定位的发布;OpenAI 没有为英国、瑞士和欧洲经济区的 ChatGPT 客户提供发布时间表。

要使用 ChatGPT 深度研究,你只需在撰写器中选择“深度研究”,然后输入查询,并可以选择附加文件或电子表格。(目前仅支持网页版,移动和桌面应用程序集成将在本月晚些时候推出。)深度研究可能需要 5 到 30 分钟来回答问题,搜索完成后你会收到通知。

目前,ChatGPT 深度研究的输出仅为文本。但 OpenAI 表示,它计划很快添加嵌入式图像、数据可视化和其他“分析”输出。OpenAI 还补充说,未来还将支持连接“更专业的数据源”,包括“基于订阅的”和内部资源。

最大的问题是,ChatGPT 深度研究的精确度如何?毕竟,AI 并不完美。它容易出现幻觉和其他类型的错误,这在“深度研究”场景中可能特别有害。这或许就是为什么 OpenAI 表示,每个 ChatGPT 深度研究的输出都将“完全记录,带有清晰的引用和思考总结,便于参考和验证信息”。

目前尚不清楚这些缓解措施是否足以应对 AI 错误。OpenAI 在 ChatGPT 中的 AI 驱动的网络搜索功能 ChatGPT Search 经常出错并给出错误答案。TechCrunch 的测试发现,对于某些查询,ChatGPT Search 产生的结果不如 Google Search 有用。

为了提高深度研究的准确性,OpenAI 使用了其最近发布的 o3 “推理” AI 模型的特殊版本,该模型通过“需要浏览器和 Python 工具使用的真实世界任务”进行强化学习训练。强化学习本质上是通过试错“教导”模型以实现特定目标。随着模型接近目标,它会获得虚拟“奖励”,理想情况下,这会使它在未来的任务中表现得更好。

该公司表示,这个版本的 OpenAI o3 模型“针对网络浏览和数据分析进行了优化”,并补充说“它利用推理来搜索、解释和分析互联网上的大量文本、图像和 PDF,根据需要根据遇到的信息进行调整 […] 该模型还能够浏览用户上传的文件,使用 Python 工具绘制和迭代图表,在其响应中嵌入生成的图表和网站图像,并引用其来源中的特定句子或段落。”

该公司表示,它使用“人类的最后考试”(Humanity’s Last Exam)测试了 ChatGPT 深度研究,该评估包括 3,000 多个学术领域的专家级问题。支持深度研究的 o3 模型的准确率为 26.6%,这看起来可能像是不及格——但“人类的最后考试”被设计得比其他基准更难,以保持领先于模型的进步。根据 OpenAI 的说法,深度研究 o3 模型远远领先于 Gemini Thinking(6.2%)、Grok-2(3.8%)和 OpenAI 自己的 GPT-4o(3.3%)。

图片[2]-OpenAI推出新的ChatGPT代理用于“深度研究”-夸夸软件库

尽管如此,OpenAI 指出,ChatGPT 深度研究仍有局限性,有时会犯错误并做出错误的推断。该公司表示,深度研究可能难以区分权威信息和谣言,并且经常无法传达其对某件事的不确定性——它还可能在报告和引用中出现格式错误。

对于任何担心生成式 AI 对学生或任何试图在线查找信息的人的影响的人来说,这种深入、引用充分的输出可能比没有引用的看似简单的聊天机器人摘要更具吸引力。但我们将看到大多数用户是否真的会对输出进行实际分析和双重检查,或者他们是否只是将其视为更专业的文本来复制粘贴。

如果这一切听起来很熟悉,谷歌实际上在不到两个月前宣布了一个具有完全相同名称的类似 AI 功能。

© 版权声明
THE END
喜欢就支持一下吧
评论 抢沙发

请登录后发表评论

    暂无评论内容