分析师的黄昏？OpenAI推出AI Agent“深度研究”，主打“金融、科学、政策和工程等领域”

发布时间：2025-02-05 23:13

科技催生了新的职业领域，如数据分析师、AI工程师等。 #生活知识# #生活感悟# #科技生活变迁# #科技改变工作方式#

来源：华尔街见闻

简单来说，ChatGPT的“深度研究”功能适用于那些不只想要快速获取答案或摘要，而是需要综合考虑多个网站及其他信息来源，不断深入挖掘直到找到最合适的答案的任务。Altman表示：“它真的很好，可以完成需要数小时/数天且花费数百美元的任务。”

本文作者：蒋紫涵

来源：硬AI

OpenAI推出AI Agent“深度研究”，分析师要失业了？

当地时间2月2日，OpenAI在直播中宣布推出一款全新的AI代理（AI agent），名称叫做“深度研究”（Deep Research），旨在帮助用户利用ChatGPT进行深入、复杂的研究。

OpenAI表示，该功能专为“在金融、科学、政策和工程等领域从事高强度知识工作的人员”设计，提供全面、精准、可靠的研究支持，并且，该功能同样适用于需要进行细致调研的大宗消费决策，例如汽车、家电、家具购买等。

简单来说，ChatGPT的“深度研究”功能适用于那些不只想要快速获取答案或摘要，而是需要综合考虑多个网站及其他信息来源，不断深入挖掘直到找到最合适的答案的任务。

Altman写道：

“它可以去互联网，做复杂的研究和推理，然后给你一份报告。它真的很好，可以完成需要数小时/数天且花费数百美元的任务。”

“它计算量很大且速度很慢，但它是第一个可以执行如此广泛复杂、有价值的任务的AI系统。”

对此，网友们跃跃欲试，有人“已经准备好使用它了”，还有人自报账号请求先一步用上ChatGPT的“深度研究”功能：

也有人提出疑问，ChatGPT的“深度研究”功能比谷歌的“深度研究”功能更强吗？会不会存在隐私问题？能不能把报告中每句话的首字母大写？

限定发布，未来将拓展至更多用户

Altman表示，ChatGPT的“深度研究”功能目前仅向ChatGPT Pro订阅用户开放，每月限额100次查询，随后将逐步推广至Plus和Team用户，最终扩展至企业级（Enterprise）用户。预计Plus版本将在约一个月后推出，并且未来付费用户的查询限制将“显著提高”。

对此，许多网友表示，200美元/月的ChatGPT Pro订阅费用太贵了：

不是免费的谁在意啊。

还有网友猜测道，等之后实现了AGI，是不是要每月收取2000美金，限额使用10次？

其实，Altman表示，免费用户也能使用，但额度非常少。

需要注意的是，“深度研究”功能目前仅在特定地区推出，OpenAI尚未公布该功能何时向英国、瑞士及欧洲经济区（EEA）用户开放。

目前，ChatGPT 深度研究的输出仅限于文本格式。不过，OpenAI计划在未来增加嵌入式图像、数据可视化及其他“分析型”输出。此外，OpenAI还表示，未来将支持接入“更多专业化的数据源”，包括“订阅制”数据库和内部资源。

研究精度如何？AI仍存局限

分析师要大面积失业了吗？关键在于，ChatGPT“深度研究”功能的精准度能否满足专业研究需求？毕竟，AI并不完美，仍然存在“幻觉”（hallucination）问题，即生成错误或虚假信息的可能性。

考虑到这一点，OpenAI透露，每次深度研究的输出都将“完整记录，附带清晰的引用来源及推理摘要，便于用户参考和验证信息”。

不过，分析认为，这一举措是否足以避免AI误导用户仍待观察——此前，OpenAI在ChatGPT内推出的AI搜索功能（ChatGPT Search）已被曝出存在错误回答的问题。TechCrunch评测发现，ChatGPT Search在某些查询上甚至不如谷歌搜索可靠。

增强精准度：使用专门优化的o3版本AI模型

为了提高深度研究的准确性，OpenAI采用了一种特殊版本的o3“推理”AI 模型，该模型经过强化学习（reinforcement learning）训练，专门针对“需要使用浏览器和Python工具的实际任务”。

OpenAI表示，该版本的o3模型“针对网页浏览和数据分析进行了优化”，可以“利用推理能力搜索、解读和分析互联网海量文本、图片及PDF，并根据新获取的信息灵活调整策略。”

该模型还可以浏览用户上传的文件，绘制并迭代调整图表，在回答中嵌入生成的图表及网页图片，并引用来源中的具体句子或段落。

为了测试该模型的效果，OpenAI采用了一项名为“人类终极考试”（Humanity’s Last Exam）的评估方法，该测试涵盖3000多道高难度学术问题，远超其他AI评估基准，以确保测试难度始终领先于模型的进步水平。

ChatGPT“深度研究”功能所使用的o3模型在测试中的准确率为26.6%——这一成绩看似不高，但相比之下，已经远超其他AI模型的得分：

谷歌 Gemini Thinking：6.2%

xAI Grok-2：3.8%

OpenAI GPT-4o：3.3%

不过，尽管如此，OpenAI仍然承认，ChatGPT“深度研究”功能存在局限性，可能会出现错误推断、误解权威信息与谣言的情况，并且，在面对不确定性时往往无法明确表述。

本文来自微信公众号“硬AI”，关注更多AI前沿资讯请移步这里

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

网址：分析师的黄昏？OpenAI推出AI Agent“深度研究”，主打“金融、科学、政策和工程等领域” https://www.yuejiaxmz.com/news/view/756877

上一篇：金融科技 API 接口：连接金融

下一篇：91 科技金融小助手全新升级，用

分析师的黄昏？OpenAI推出AI Agent“深度研究”，主打“金融、科学、政策和工程等领域”

相关内容

随便看看

最新动态分享

热点动态分享

专题

推荐动态分享