GPT-5正式发布!一键生成网页、写作像诗人、更懂健康问题!
- 1754624030656
- 来源:亚太快讯
当地时间7日,OpenAI推出了迄今最先进的大型语言模型GPT-5,这一成果历经两年多研发、多次推迟后终于面世。首席执行官山姆·奥尔特曼在发布会上形容,与GPT-5对话“就像在与某个领域的博士级专家交流”。这一版本首次采用集成模型架构,将根据任务自动选择推理深度,无需用户切换模式,并将在未来一周内分批向包括免费用户在内的所有ChatGPT用户开放。
奥尔特曼透露,GPT-5在速度、直觉与推理能力上全面提升,并能凭借“氛围编程”(vibe coding)让用户用自然语言生成可运行的软件应用程序。“它能做的最酷的事情之一,就是为你按需编写高质量的软件,这种即时开发的能力,可能会成为GPT-5时代的决定性特征。”他说。
免费体验“氛围编程”
上海第一财经报道,与上一代相比,GPT-5最大的结构性变化是采用集成模型。这意味着系统将自主判断问题的复杂度,必要时调用更多计算资源进行“深度思考”。奥尔特曼称,这是普通用户首次接触OpenAI的“测试时间计算”技术,即在面对数学推导或复杂推理时,模型会主动延长计算时间以提高准确性。
在现场演示中,GPT-5根据简单文本提示生成了完整的可运行软件,从界面设计到逻辑功能均由AI独立完成。奥尔特曼还宣布,下一阶段将显著提升语音模式的自然度与智能化水平,让语音交互更贴近真实对话。
此次发布最大的商业信号,是OpenAI将GPT-5免费提供给大部分用户,包括免费版、Plus版、Pro版和团队版,企业与教育用户也将在下周获得接入权限。这一策略被认为意在迅速扩大使用规模,并推动AI应用的二次创新。
OpenAI特别强调了GPT-5在企业级场景的实力——不仅能进行软件开发,还可在写作、健康咨询和金融分析等专业任务中表现出接近专家的水平。奥尔特曼称,这款模型“第一次让我们的主线产品具备了可以向一位真正的博士专家提问的体验”。
发布会之际,OpenAI正进行一轮股权出售和内部股权转让谈判,对公司的估值约为5000亿美元,较此前3000亿美元的估值大幅跃升。
编程、创意写作、健康领域三大优势
成都《每日经济新闻》报道,作为OpenAI的“最强大模型”,GPT-5在三个关键领域实现了显著提升。
GPT-5应用展示。(图/OpenAI官网)
首先是编程能力。GPT-5是OpenAI迄今为止最强大的编码模型,在复杂的前端生成和大型代码库调试方面表现突出,能够仅凭一个提示就创建美观响应式的网站、应用程序App和游戏。早期测试者注意到其在间距、排版和留白等设计选择方面的改进。
在从GitHub获取现实世界编码任务的基准测试SWE-bench Verified中,GPT-5思考后首次尝试的准确率达74.9%,高于OpenAI推理模型o3的69.1%和GPT-4o的30.8%。
评论指出,这意味着,GPT-5的表现略胜于Anthropic日前推出的Claude Opus4.1和谷歌DeepMind的Gemini2.5Pro,后两者在SWE-bench Verified测试的得分分别为74.5%和59.6%。
不过,在衡量数学、人文和自然科学领域模型表现的各学科专家级能力Humanity’s Last Exam测试中,带有扩展推理功能的GPT-5增强版本GPT-5pro在使用工具的情况下得分42%。这略低于得分44.4%的xAI模型Grok4Heavy。奥尔特曼称,GPT-5尤其擅长按需启动整个软件App,也就是所谓的“氛围编码”、即用AI根据自然语言提示生成功能代码,从而加快开发速度。
在创意写作方面,GPT-5能够处理结构复杂的写作任务,如无韵律的抑扬格五音步诗或自然流动的自由诗,犹如诗人。OpenAI的ChatGPT业务副总Nick Turley表示,GPT-5在创意任务上表现出“更好的品味”,响应更自然。
健康咨询是第三个重要提升领域。
GPT-5能更积极地标记潜在健康问题,帮助用户解析医疗结果,尽管OpenAI强调,ChatGPT不能替代医疗专业人员。
在名为HealthBench Hard Hallucinations的测试中,具备思考能力的GPT-5出现幻觉的错误信息率仅为1.6%。这远低于GPT-4o和o3模型,后两者的错误信息率分别为15.8%和12.9%。
现实的瓶颈
GPT-5的问世,正值全球科技巨头在AI基础设施上竞相加码。Alphabet、Meta、亚马逊以及OpenAI背后的微软,今年在AI数据中心上的资本支出预计接近4000亿美元。投资者希望这笔巨额投入能带来可观回报,但现实挑战依旧存在。
经济学作家诺亚·史密斯表示,当前消费者在AI上的支出热情高于企业端,“人们喜欢与ChatGPT聊天,但这还不足以证明庞大的数据中心投入物有所值”。对于OpenAI而言,如何将消费者热度转化为企业级营收,将是未来盈利能力的关键。
技术上,OpenAI在训练GPT-5的过程中遭遇了数据与算力瓶颈。一方面,大型语言模型依赖的高质量人类文本数据已接近极限;另一方面,模型规模越大,训练周期越长、硬件故障风险越高,团队可能需数月后才能评估一次训练的最终效果。前首席科学家伊利亚·苏茨克弗就曾提到,算力虽在持续增长,但数据供给的速度远远跟不上。
即便如此,奥尔特曼依然认为全球在AI基础设施上的投资“远远不足”,并强调OpenAI的使命是“构建造福全人类的人工智能”。在他看来,GPT-5并非终点,而是迈向更强大、更通用AI的重要一步。
此外,微软在GPT-5发布当日即宣布,将其整合到广泛的产品线中。在企业级应用方面,Microsoft 365 Copilot将利用GPT-5更好地处理复杂问题、在长对话中保持专注并理解用户上下文。企业用户可通过推理功能处理电子邮件、文档和文件。
编辑:凉子
相关新闻