o3猜照片位置深度思考6分48秒，范围精确到“这么近那么美”

人脑网 • 2025年4月27日下午3:31 • 智能 • 阅读 17

ChatGPT新玩法，让程序员大佬Simon Willison直呼太反乌托邦了，像科幻突然变成现实：

只需一张照片，靠带图深度思考就能猜出地理位置。

这种玩法很简单，随手拍一张风景，没有任何明显的地标即可，也不需要复杂的提示词，只需要问“猜猜这张照片是在哪里拍的？”（需要o3/o4-mini的带图思考，先关闭所有记忆功能）。

只见ChatGPT从山看到植物，从建筑细节分析到车辆，运行代码截取放大车牌数次。

最终得出结果，离准确答案只差200-300公里，相当于从北京到河北，这么近那么美。

ChatGPT的策略是先猜个大概，再根据画面细节一步步缩小范围锁定结论，给出的依据如下：

首先车牌是加州样式→基本确定在加州。

很多加州常见植物和标志性蓝天→典型的加州中部沿海植被和气候。

低矮的淡色海滩小屋，配有白色尖桩篱笆和绳索和柱子搭建的露台栏杆→圣克鲁斯和皮斯莫之间的海滩小镇的常见建筑。

城镇后面连绵起伏的绿色海岸山脉（没有高峰，没有雪）→符合圣卢西亚/圣克鲁斯沿海丘陵。

最终ChatGPT给出结论：

正确答案正是在埃尔格拉纳达附近的一家露天酒吧里拍的，ChatGPT只靠一小段道路、一栋无名的房子和背景中的小山猜得非常接近。

看到这里，论坛上专门玩猜照片位置的竞技级玩家也不得不服气，承认AI能记住的信息远超人类大脑能力。

一张照片裁剪放大25次

作者Simon Willison分享了完整的对话记录，包括6分钟的完整深度思考记录。

虽然ChatGPT能猜得很接近，但过程还是很波折。

首先是一个开幕雷击，AI突然“瞎”了认为自己无法直接看到图片。

可能是训练数据包含太多之前单模态语言模型的数据太多了，不过丝毫不影响后面继续发挥。

现浏览一下整体，ChatGPT心里就已经大致有数，后面都是寻找证据。

放大车牌这一步动用了代码工具，

基本锁定了加州作为大方向，开始进一步分析细节。

接下来反复裁剪、放大照片的某个区域，思考它所看到的内容，将其与之前的观察结果进行比较，然后再次裁剪、放大和分析。

它就这样持续思考了6分多钟，期间也有裁剪错位置。

不过每一次都能退回上一步重来。

在深度思考的结尾，ChatGPT甚至尝试把范围缩小到一个具体的餐厅。

整个过程看下来，作者Simon Willison怀疑模型的视觉输入分辨率很低，所以裁剪到更靠近车牌的位置会对思考过程产生重大影响。

但对一张照片裁剪操作25次还是有些夸张了。

o3不是唯一一个能根据照片猜测地理位置的AI模型，但它的独特之处就在于工具使用被集成到推理阶段。

预计其他模型开发商也会跟进这个特性。

后面Simon Willison还发现一点小疏忽，ChatGPT应用其实能获取使用者的大致位置信息，可能是为了改进联网搜索结果加上的。

不过这不影响试验的结果，如果ChatGPT知道位置信息，就不会把真正的答案埃尔格拉纳达放到备选结果里。

为了验证这一点，作者还试验了两张在数千公里外旅行时的照片，且通过截图抹除照片的EXIF信息，o3也都猜对了。

试试你能不能猜出来这两张照片分别在哪里？

ChatGPT悄悄更新，但是不知道更新了什么

就在这半个周末，ChatGPT再次悄悄更新，GPT-4o的智力和个性都得到升级。

不过只有奥特曼的一句话，到底更新的是APP呢还是API呢还是都升级了呢，还要靠员工来补充：只有ChatGPT应用上升级了。

OpenAI这种越来越不透明的现象也被更多人批评。

更详细的信息（也不太详细）发布在ChatGPT帮助中心的更新日志里。

有人感觉到GPT-4o升级之后有什么变化么？欢迎在评论区分享。

参考链接：
[1]https://simonwillison.net/2025/Apr/26/o3-photo-locations/
[2]https://news.ycombinator.com/item?id=43803243
[3]https://x.com/sama/status/1915902652703248679
[4]https://help.openai.com/en/articles/9624314-model-release-notes

主题测试文章，只做测试使用。发布者：人脑网，转转请注明出处：https://www.rennao.com.cn/8842.html

赞 (0)

0 0

1450亿!马斯克xAI与X合并后再寻资金,将成第二大初创企业单轮融资

上一篇 2025年4月27日下午3:30

GitHub版DeepResearch来了！覆盖所有代码库，模型架构可视化

下一篇 2025年4月27日下午3:31

智能

榨干3000元显卡，跑通千亿级大模型的秘方来了

书接上回，用几块3000元显卡作为加速主力的一体机，就能跑通671B的DeepSeek。放在个把月前，你敢想象这样的场景么？正在埋头苦干，希望有更多样化产品交付的一体机厂商们，pick英特尔锐炫™ 显卡 + 至强® W 处理器这套组合拳，首要原因就是它的成本确实诱人——基本算是砍掉了一个数量级（下线可以控制在10万元以内）。其次就是这套组合也很能打，上…

人脑网
2025年4月15日
37000
智能

装满智能体AI的手机，正在呼唤一个“Type-C时刻”

当手机中装满智能体，下一代AI手机的雏形正在显现。天玑开发者大会上，手机芯片巨头联发科提出了全新的AGENTIC AI UX雏形。在联发科的畅想中，AI助手不再是一个单纯的执行者，而是变成了一个能够协作，甚至“懂得拒绝”的伙伴。一同发布的，还有全新升级的旗舰5G智能体AI芯片天玑9400+，AI能力再次升级。相比前半代的“端侧AI最强芯”天玑9400…

人脑网
2025年4月16日
44000
智能

智能车速度刷新：仅10个月，首个纯端侧大模型上车量产！

端侧大模型圈子的《速度与激情》，就这么水灵灵地上演了。坐标上海车展，在长安马自达新车发布之际，车上的智能座舱竟然成了大亮点之一。因为速度着实有点太快——从零到量产，只花了10个月的时间！要知道，这件事儿在汽车领域里面，一般都是要按“年”这个单位来计算。此举可谓是一鸣惊人，一举刷新行业纪录，一步迈进了“月”的计量单位。而且啊，搞出这件事的，还是车圈的…

人脑网
2025年4月25日
20000
智能

速戳报名！最新AIGC峰会嘉宾在此，4月16日，来和大佬们一起AI

4月16日，北京金茂万丽酒店，第三届中国AIGC产业峰会就要来啦！观众报名通道已开启 https://hdxu.cn/Arf5 今年峰会主题是「万物皆可AI」，我们看到随着基础模型的深入发展，更多的AI新产品、新物种正在涌现。我们希望让更多的AI落地被看见，让更多人用上AI、用好AI，与AI一同加速成长。为此，我们邀请到了百度、华为、AWS、无问芯穹、数…

人脑网
2025年4月6日
41000
智能

全球闲置算力训个模型，性能媲美R1，老黄天塌了！Karpathy曾投资

一夜之间，老黄天塌了（doge）。全球首个分布式RL训练模型INTELLECT-2发布，它仅通过整合全球闲置或分散的计算资源，就完成了模型的强化学习训练，训练成本大大降低。其模型性能与DeepSeek-R1媲美！一旦范式成立，这也就意味RL训练摆脱了对集中式算力的依赖，世界上任何一个人都可以参与到模型训练当中，大公司垄断算力时代可能就此终结。 Just…

人脑网
2025年5月13日
10000

发表回复

联系我们

400-800-8888

在线咨询： QQ交谈

邮件：admin@example.com

工作时间：周一至周五，9:30-18:30，节假日休息

关注微信