分析师的黄昏?OpenAI推出AI Agent“深度研究”,主打“金融、科学、政策和工程等领域”
科技催生了新的职业领域,如数据分析师、AI工程师等。 #生活知识# #生活感悟# #科技生活变迁# #科技改变工作方式#
来源:华尔街见闻
简单来说,ChatGPT的“深度研究”功能适用于那些不只想要快速获取答案或摘要,而是需要综合考虑多个网站及其他信息来源,不断深入挖掘直到找到最合适的答案的任务。Altman表示:“它真的很好,可以完成需要数小时/数天且花费数百美元的任务。”
本文作者:蒋紫涵
来源:硬AI
OpenAI推出AI Agent“深度研究”,分析师要失业了?
当地时间2月2日,OpenAI在直播中宣布推出一款全新的AI代理(AI agent),名称叫做“深度研究”(Deep Research),旨在帮助用户利用ChatGPT进行深入、复杂的研究。
OpenAI表示,该功能专为“在金融、科学、政策和工程等领域从事高强度知识工作的人员”设计,提供全面、精准、可靠的研究支持,并且,该功能同样适用于需要进行细致调研的大宗消费决策,例如汽车、家电、家具购买等。
简单来说,ChatGPT的“深度研究”功能适用于那些不只想要快速获取答案或摘要,而是需要综合考虑多个网站及其他信息来源,不断深入挖掘直到找到最合适的答案的任务。
Altman写道:
“它可以去互联网,做复杂的研究和推理,然后给你一份报告。它真的很好,可以完成需要数小时/数天且花费数百美元的任务。”
“它计算量很大且速度很慢,但它是第一个可以执行如此广泛复杂、有价值的任务的AI系统。”
对此,网友们跃跃欲试,有人“已经准备好使用它了”,还有人自报账号请求先一步用上ChatGPT的“深度研究”功能:
也有人提出疑问,ChatGPT的“深度研究”功能比谷歌的“深度研究”功能更强吗?会不会存在隐私问题?能不能把报告中每句话的首字母大写?
限定发布,未来将拓展至更多用户
Altman表示,ChatGPT的“深度研究”功能目前仅向ChatGPT Pro订阅用户开放,每月限额100次查询,随后将逐步推广至Plus和Team用户,最终扩展至企业级(Enterprise)用户。预计Plus版本将在约一个月后推出,并且未来付费用户的查询限制将“显著提高”。
对此,许多网友表示,200美元/月的ChatGPT Pro订阅费用太贵了:
不是免费的谁在意啊。
还有网友猜测道,等之后实现了AGI,是不是要每月收取2000美金,限额使用10次?
其实,Altman表示,免费用户也能使用,但额度非常少。
需要注意的是,“深度研究”功能目前仅在特定地区推出,OpenAI尚未公布该功能何时向英国、瑞士及欧洲经济区(EEA)用户开放。
目前,ChatGPT 深度研究的输出仅限于文本格式。不过,OpenAI计划在未来增加嵌入式图像、数据可视化及其他“分析型”输出。此外,OpenAI还表示,未来将支持接入“更多专业化的数据源”,包括“订阅制”数据库和内部资源。
研究精度如何?AI仍存局限
分析师要大面积失业了吗?关键在于,ChatGPT“深度研究”功能的精准度能否满足专业研究需求?毕竟,AI并不完美,仍然存在“幻觉”(hallucination)问题,即生成错误或虚假信息的可能性。
考虑到这一点,OpenAI透露,每次深度研究的输出都将“完整记录,附带清晰的引用来源及推理摘要,便于用户参考和验证信息”。
不过,分析认为,这一举措是否足以避免AI误导用户仍待观察——此前,OpenAI在ChatGPT内推出的AI搜索功能(ChatGPT Search)已被曝出存在错误回答的问题。TechCrunch评测发现,ChatGPT Search在某些查询上甚至不如谷歌搜索可靠。
增强精准度:使用专门优化的o3版本AI模型
为了提高深度研究的准确性,OpenAI采用了一种特殊版本的o3“推理”AI 模型,该模型经过强化学习(reinforcement learning)训练,专门针对“需要使用浏览器和Python工具的实际任务”。
OpenAI表示,该版本的o3模型“针对网页浏览和数据分析进行了优化”,可以“利用推理能力搜索、解读和分析互联网海量文本、图片及PDF,并根据新获取的信息灵活调整策略。”
该模型还可以浏览用户上传的文件,绘制并迭代调整图表,在回答中嵌入生成的图表及网页图片,并引用来源中的具体句子或段落。
为了测试该模型的效果,OpenAI采用了一项名为“人类终极考试”(Humanity’s Last Exam)的评估方法,该测试涵盖3000多道高难度学术问题,远超其他AI评估基准,以确保测试难度始终领先于模型的进步水平。
ChatGPT“深度研究”功能所使用的o3模型在测试中的准确率为26.6%——这一成绩看似不高,但相比之下,已经远超其他AI模型的得分:
谷歌 Gemini Thinking:6.2%
xAI Grok-2:3.8%
OpenAI GPT-4o:3.3%
不过,尽管如此,OpenAI仍然承认,ChatGPT“深度研究”功能存在局限性,可能会出现错误推断、误解权威信息与谣言的情况,并且,在面对不确定性时往往无法明确表述。
本文来自微信公众号“硬AI”,关注更多AI前沿资讯请移步这里
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
网址:分析师的黄昏?OpenAI推出AI Agent“深度研究”,主打“金融、科学、政策和工程等领域” https://www.yuejiaxmz.com/news/view/756877
相关内容
数字员工、超级个体、具身智能,AI Agent未来发展十大研究方向AI Agent在11个领域100个应用场景
2024年终探索: AI Agent未来展望——历史演进、应用落地与商业价值的深度剖析
美年健康:大模型与AI Agent赋能,引领医疗人工智能应用 随着科技迅猛发展,人工智能已悄然融入生活各个角落。在12 月 14日结束的第七场发布上,Open AI 作为全球AI领域...
AiBot:AI Agent在11个行业100个常见应用场景汇总 人工智能代理(AI Agent)的发展正在以前所未有的速度改变我们的生活和工作方式。从日常生活的小事到企业级的复杂决策,...
美年健康:大模型与AI Agent赋能,引领医疗人工智能应用
Sam Altman:明年OpenAI将迈入AI系统时代
AI Agent:7个国内框架 & Agent应用
关注AI眼镜、Agent发布,布局AI社交陪伴等应用
用AI玩转金融投研 | 低成本创业 高品质生活