OpenAI o3/o4 mini 模型正式发布
今日凌晨,OpenAI 正式推出了 o3/o4 mini 模型,OpenAI CEO Sam Altman 直呼「o3 达到或接近天才的水平」。快速过一次 OpenAI o3/o4 mini 的亮点,具体如下:
- o 系列迄今最智能的模型,推理能力大幅提升,思考时间越长,效果越好。
- 首次将图像直接融入思维链,用图片「思考」,能直接调用工具处理图片。
- 首次全面支持网页搜索、文件分析、Python 代码执行、视觉输入深度推理和图像生成等功能。
- 成本效率上优于前代,o3 在相同延迟和成本下性能更强。
在性能测试具体表现上:
- o3 在编程、数学、科学和视觉感知领域创下新纪录:视觉任务准确率达 87.5%,MathVista 也有 75.4%。
- 外部专家评估显示,o3 在编程、商业咨询和创意构思的重大错误率也比 o1 低 20%,在生物学、数学和工程领域能生成并批判性评估新颖假设。
- o4-mini 「体型更小」,优化了快速、低成本推理,在 AIME 2024 和 2025 数学测试中准确率分别为 92.7% 和 93.4%,在非 STEM 和数据科学任务中优于 o3-mini。
- o3 和 o4-mini 在 AIME、Codeforces、GPQA 和 MMMU 等测试中全面超越前代,且指令遵循和响应质量也都显著提升,结合记忆功能和历史对话引用,回答更个性化、更相关。
成本方面,o3 输入每百万 tokens(大约 75 万个词,长度超过《指环王》系列)的费用为 10 美元,输出每百万 tokens 的费用为 40 美元;o4-mini 输入每百万 tokens 的费用为 1.10 美元,输出每百万 tokens 的费用为 4.40 美元。
另外,OpenAI 还推出了一款轻量级终端编码 Agent —— Codex CLI。基于 o3 和 o4-mini 的推理能力,Codex CLI 支持多模态输入,已在 GitHub 开源。Codex 有两种运行模式:
- 「建议模式」(默认):提出命令供用户确认;
- 「全自动模式」:禁用网络访问,让 Agent 自主工作但保持安全。
未来,o3/o4 mini 在模型选择器上取代 o1 等模型。而用户使用权限具体情况如下:
- ChatGPT Plus、Pro 和 Team 用户即日起可使用 o3、o4-mini 和 o4-mini-high,企业与教育用户一周后获访问权限。另外,o3-pro 预计数周内发布。
- 免费用户可通过「Think」模式使用 o4-mini,速率限制不变。
- 开发者则通过 Chat Completions API 和 Responses API 访问,支持推理摘要和函数调用优化,即将支持网页搜索等内置工具。
我们也上手实测了最新模型的表现,点击链接查收吧!👇
刚刚,OpenAI 最强推理模型 o3 发布!首次能用图片思考,奥特曼:天才水平

马斯克被曝不再热爱汽车,Model 2 或胎死腹中
据 The Information 报道,马斯克在去年确定了特斯拉不再是一家电动汽车公司,报道指出,虽然特斯拉依然制造汽车,但将不会是众多粉丝、投资者所期待的全新大众市场车型。
目前,马斯克已将特斯拉的赌注押在了 AI 产品上,如 Robotaxi(无人出租车)和具形机器人。据报道,马斯克还否决了手下们的内部研究:质疑 Robotaxi 的前景、推出一款 2.5 万美元、面向家庭的经济型跨界 SUV。
马斯克对 Robotaxi 十分看好,认为能卖出数百万辆 Robotaxi 赚取巨额利润,但据他手下泼出了一盆冷水:Robotaxi 在个人和共享出行的销售可能只能卖出数十万辆,并且永远无法盈利。
而上述的 2.5 万美元跨界 SUV,也就是被传已久的特斯拉 Model 2 车型。但据知情人士原因马斯克手下消息透露,因为该款车型会冲击到 Robotaxi 的规划目标,并且 Model 2 和 Robotaxi 将会采用同一平台,因此马斯克直言「不行」。
报道指出,2024 年 2 月,特斯拉内部讨论了截至目前为止,最后一次关于 Model 2 车型的会议。会上,马斯克宁愿削减现有 Model Y 车型的功能来降低价格,也不愿意让 Model 2 落地。值得一提的是,会议上力争 Model 2 车型的三位高管,都在同年 4 月离开了特斯拉。
报道还提到,据了解马斯克的人士称,马斯克已经失去了对电动汽车的兴趣,在他看来,刺激电动车行业发展的目的已经基本完成,接下来的任务就是不断推新车、应付华尔街分析师等常规工作。
微信首个 AI 助手,「元宝」正式入驻
继接入 DeepSeek 后,爱范儿发现名为「元宝」的 AI 助手目前已经正式入驻微信。目前,微信用户可以在微信框搜索「元宝」,亦或者直接扫描上面的二维码图片,将其添加到通讯录,即可与它展开对话。
据官方介绍,元宝 AI 是腾讯元宝 APP 入驻微信的 AI 助手,搭载混元和 DeepSeek 双模引擎,无缝衔接微信生态。我们也第一时间上手,亮点概括如下:
- 由腾讯混元大模型和 DeepSeek 提供 AI 服务,支持聊天,答题;
- 支持文字和语音消息输入,以联系人身份嵌入微信通讯录,聊天时会显示「对方正在输入…」;
- 生成部分内容时会提供跳转页面,支持跳转到元宝 APP 进行后续追问;
- 可自动解读转发的公众号文章,支持解析 100M 以内的文件,暂不支持理解视频或音频内容;
- 具有「记忆」功能,支持如查找、转发、清空聊天记录;
- 鸿蒙微信 1.0.5 版本暂不支持「元宝」
而更多详细内容,可以点击下方链接查收!👇
刚刚,微信首个 AI 助手上线!实测后我发现这些亮点
美国限制限制英伟达在华销售 H20 芯片
4 月 16 日,英伟达发布公告称,美国政府于 4 月 9 日通知该公司,向中国(包括香港、澳门地区)及 D:5 国家或地区(D:5 指美国《出口管制条例》中的武器禁运国家或地区),或向总部位于或最终母公司位于这些国家的公司出口 H20 芯片,以及任何其他性能达到 H20 内存带宽、互连带宽或其组合的芯片,都必须获得出口许可。
公告披露,美国政府称,这旨在解决相关产品可能被用于或被转用于中国超级计算机的风险。4 月 14 日,美国政府通知英伟达,该许可要求将无限期有效。据路透社报道,美国商务部于近期确认,将对英伟达 H20 和 AMD 的 MI308 芯片及两家公司的等效产品实施新的出口许可要求。
据 CNN 消息,英伟达表示因受到 H20 芯片限制,公司将会受到 55 亿美元的损失;昨日,英伟达股价在盘前交易中暴跌,跌幅超过 7%。
英伟达 H20 于去年发布。据了解,英伟达特意在 H20 的性能架构上进行设计,以适应美国对中国出口控制,从而让英伟达能继续向后者进行销售。H20 的能力低于更强大的 H100 人工智能芯片,但后者已被美国禁止向中国销售。
消息称字节整合 AI 研发团队
据 AI 科技评论获悉,字节跳动整合了旗下的 AI 研发团队:字节 AI Lab 即将全部收归 Seed 团队下。
字节 AI Lab 成立于 2016 年,最初由微软亚洲研究院前常务副院长马维英负责,直接向张一鸣汇报。 AI lab 目前有多个子团队,包括机器人、AI4S 等方向,几乎覆盖人工智能领域所有前沿技术研究。2018 年其团队规模达到 150 人,为字节跳动 AI 研究的核心部门。
AI Lab 主要研究重点是开发为字节跳动内容平台服务的创新技术,字节推荐算法、短视频特效等功能均脱胎于此。随着抖音、TikTok 占据绝对优势的市场地位,流量商业化成为字节面临的首要问题,AI Lab 在字节内部重要性下降。
2020 年年中,马维英离开字节,AI Lab 负责人一职由李航接任至今。之后团队重组,2023 年开始,AI Lab 下属负责大语言模型的 NLP 组及开发视频生成模型的 PixleDance 被先后转入 Seed 之下。
而 Seed 在字节决定回归「始终创业」价值观的背景下诞生,负责大模型研发。截至 2023 年底,已成为与抖音、火山引擎等字节各大业务平级的组织之一。报道指出,吴永辉于上月在 Seed 内部新建虚拟小组、缩短了汇报流程,创建一个更扁平的汇报体系,此次 AI Lab 将全部并入 Seed,也是吴永辉调整内部组织架构的一个重要举措。
马自达重启「转子发动机」研发团队
近日,据 Road&Track 报道,马自达或准备在市场中推出两款不同的跑车,一台为新款 MX5,而另一台则是马自达于 2023 年公布的 Iconic SP 概念车,而后者将配备曾被视作马自达灵魂的转子发动机。
马自达 CEO 毛笼胜弘确认,公司已重启转子发动机研发团队,并明确要求团队的首要任务是让发动机符合美国 LEV IV 和欧洲 Euro 7 的排放标准。毛笼胜弘指出,马自达很清楚转子发动机在过去,排放达标方面一直存在问题,这也是 2012 年停产的主要原因。但在过去一年中,相关的项目进展也令人振奋。
据了解,马自达在 2023 年就已经将转子发动机带回到了量产车上:海外销售的 MX-30 R-EV 上的转子发动机,被用作发电增程器。而在 2012 年之前,马自达克服了转子发动机的缺陷,将该技术安装到了一代经典跑车 RX-7 身上,并以此打入美国市场。
小米 YU7 确认缺席上海国际车展
日前,小米汽车副总裁李肖爽宣布小米汽车将参加 2025 届上海国际车展,届时小米 SU7 Ultra、小米 SU7 全系产品均会展出。随后有网友在评论区留言询问关注度极高的小米 YU7 车型「是否展出」,李肖爽回答「没有 YU7」。
据了解,小米 YU7 车型于上年 12 月公布,预计于今年 6、7 月正式上市。据工信部官网显示,小米 YU7 车长 4999mm、车宽 1996mm、车高仅有 1600mm,轴距则达到了 3 米。动力方面,小米 YU7 搭载双电机系统,前电机 220kW,后电机 288kW,总功率高达 508kW(约为 681 马力),最高车速为 253km/h。
上月,小米创始人雷军亲自在武汉大学,为小米 YU7 拍摄预热宣传图。从网友信息得知,雷军本人在凌晨就开始拍摄相关工作,「雷军小米 YU7 樱花照」「小米 YU7」等相关话题也随即登上热搜。而据爆料博主数码闲聊站透露,本次雷军亲自拍摄宣传图,也代表小米 YU7 开启预热,小米 YU7 将按照此前小米 SU7 的发布节奏「先预发布」。
河南成为飞书成长最快的区域之一
昨日,以「豫见新速度,AI 上中原」为主题的 2025 飞书先进生产力峰会在郑州举办。本次峰会汇聚数百位企业一号位及高管参与,围绕数字化转型与 AI 应用等视角,展现河南企业的数字化转型故事。
会上,飞书首席商业官林婵表示,河南是飞书增速最快的区域之一,5 年时间取得了数十倍客户量级的增长。据悉,伴随着河南企业的高速发展,飞书不止收获了「三头象」,更是见证了一批「象群」的奔跑:
- 胖东来:飞书的企业效能顾问在服务胖东来的过程中,深入各个业务线、一线卖场,和一线员工共同打磨出上百个业务场景的解决方案;
- 巴奴集团:运用飞书低代码平台,巴奴实现了高度自定义的数字能力,可以根据自身需求搭建工作流;
- 双汇集团:飞书帮助双汇构建了「汇工作」平台,并集合了上下游产业链的系统;
- 郑煤机集团:集团连续 2 年举办效率先锋大赛,培养出了 100 多名先锋,产生优秀落地实践 50 多个,一线实际业务实践超 300 个。
飞书解决方案总经理孙昊天表示,「AI 正从知识沉淀、管理透明、工作减负层面给企业带来正向的改变。」最后,孙昊天为企业提供了落地 AI 的建议,他提出「数据是基石、工具是杠杆、文化是土壤,有了这三个才能在企业内找到场景,挖到金矿。」
苹果公布最新环保进展
值此地球日之际,苹果通过为回收设备的用户提供特别优惠等方式,携手各团队、合作伙伴与全球用户共同迎接地球日的到来,并公布公司在环境项目方面所取得的突破性进展:
- 公司全球温室气体排放量较 2015 年基准已减少 60% 以上。
- 公司同时达成多项环保里程碑:在所有磁铁中使用 99% 再生稀土元素、在所有苹果设计的电池中采用 99% 再生钴材料。
- 供应链加速向清洁能源转型:2024 年苹果供应商采购的可再生能源避免了 2180 万吨碳排放,同比增幅超 17%。此外,通过在优化能效方面,供应商去年额外减排近 200 万吨。
- 推动更清洁的半导体生产:至 2030 年将苹果相关生产的 F-GHG 排放削减至少 90%,而 2024 年显示面板与半导体供应商已减排 840 万公吨。
- 减少数百万公吨废弃物:2024 年参与苹果零废弃物计划的供应商已实现约 60 万吨的废弃物转化,自 2015 年该计划启动以来,已累计转化废弃物达 360 万吨。
- 年节水数千万立方米:自 2013 年启动供应商清洁用水项目以来,苹果与供应商累计节水超 900 亿加仑。
另外,为庆祝世界地球日,苹果为用户提供了多种学习和参与环保行动的方式,:
- 即日起至 5 月 16 日,顾客到店(Apple Store)使用符合条件的设备折抵换购 Apple 配件时,可享九折优惠。
- 4 月 22 日,Apple Watch 用户完成 30 分钟以上任意体能训练,即可获得地球日限定版奖章,以鼓励他们走向户外、保持活跃。
- 通过提示 App 中的新「地球日」专题,用户可探索 iPhone 的环保功能,包括用照片 app 识别植物、定制和下载离线地图供户外探索、设置家庭节电措施等。
Claude Research 上线,深度整合 Google
昨日凌晨,Anthropic 宣布 Claude 将上线 Research 功能和 Google Workspace 深度集成。
Claude 本次新增的 Research 功能,与此前 OpenAI 在 ChatGPT 中所推出的 Deep Research 类似,能够主动进行多轮搜索,逐步深入问题并进行多角度探索,最后系统性地为用户提供更高质量的回答内容。值得一提的是,本次 Claude 的 Research 拥有代理式(Agentic)搜索框架,支持自主规划并执行多步骤搜索任务。
为了增强 Claude 各方面能力,Anthropic 为其深度集成了 Google Workspace 应用套件:现在 Claude 可以直接访问用户的 Gmail、Google 日历、Google 文档。得益于深度集成,Claude 还能通过访问邮件、日历安排、文档内容进行分析,自动获取相关任务的上下文,并能生成项目相关资料。
据悉,本次 Google Workspace 依靠 Anthropic 的 MCP 协议,这也意味着 Agent 的形态又一次变得清晰起来,真正能让用户少动手,高回报率地获得想要的内容。
目前,两个新功能均处于 Beta 阶段。其中 Research 面向美国、日本、巴西地区的 Max、Team、Enterprise 付费计划用户开放;而 Google Workspace 集成面向所有付费计划用户,但需要注意的是,Team 和 Enterprise 计划的管理员需先在组织层面授权该集成。
另外,据彭博社报道,Claude 的语音模型将在本月上线。报道透露,Claude 的语音模式初期会采用小范围、少量的形式进行测试、迭代。具体功能方面,Anthropic 目前计划为语音模式配备三种初始语音,分别命名为 Airy(轻快)、Mellow(醇和)以及带有英伦口音的 Buttery(圆润)。
蚂蚁百宝箱正式推出「MCP 专区」
4 月 16 日,为提升智能体(AI Agent)与外部工具的配置效率,蚂蚁智能体平台—百宝箱推出「MCP 专区」,全面支持各类 MCP 服务的部署和调用。
据了解,「百宝箱」是蚂蚁集团面向 AI 开发者搭建的一站式智能体开发平台,支持 DeepSeek、通义千问、Kimi、智谱等主流大模型接入,提供 50 多款插件和近百款工具。依托支付宝的应用生态,现已提供多个行业的智能体。另外,百宝箱不仅支持一键发布至多个生态渠道,还可通过 API 或 SDK 集成至企业业务系统。
而 MCP(Model Context Protocol,模型上下文协议)是专为大语言模型(LLM)应用设计的开放协议,旨在实现 LLM 与外部数据源、工具的无缝集成。该协议于上年 11 月由 Anthropic 发布。
目前,开发者通过百宝箱,可调用支付宝、高德地图、无影等 30 余款 MCP 服务,最快 3 分钟即可搭建一个连接 MCP 服务的智能体。
💡 OpenAI CPO:AI 的科技创新浪潮才刚开始
近日,OpenAI 首席产品官 Kevin Weil 做客 Lenny’s Podcast 对话节目,其与主持人讨论了「AI 对工作的影响」「AI 时代最重要的技能是什么」等一系列话题。
最令人印象深刻的就是 Kevin Weil 对 AI 抱有较为乐观的心态。Kevin 自己表示,技术推动使人类在当今获得了许多进步,而技术是几乎一切的根源。他指出,AI 模型正在以惊人的速度变得更智能、更快、更便宜和更安全,并且这种进步速度远超摩尔定律的预测。因此 Kevin 也强调:
今天我们使用的 AI 模型只是未来模型的最基础版本,科技创新的浪潮才刚刚开始。
Kevin 还在对话中提到了 AI 与孩子的教育培养,应该是「共存」。Kevin 对 AI 个性化辅导的潜力十分惊讶,并表示「这应该是 AI 能做的、最重要的事情之一。」而对于培养孩子的兴趣能力,Kevin 虽然认同「编程」在很长一段时间内都很重要,但他更认为培养孩子的好奇心、独立、自信和思考能力才是更重要的。
另外,Kevin 还强调了「AI 不会取代创造力」。他通过自己的日常工作来阐述了这一点:用 Sora 生成多个不同版本的内容,同时进行头脑风暴,但最后依然会选择效果最好的一版,交给人类艺术家去制作最终版本。
评论
发表评论