AI的进步总会带来了一些令人意想不到但不安的可能性。最近,一款名为GeoSpy的AI工具引起了公众的广泛关注,它能够仅通过一张照片就精确地定位出拍照地点的经纬度,其精确度之高令人震惊。文章中提到,GeoSpy通过分析照片中的光线、植物、建筑风格、天气等细节,与大量的街景和地理照片进行对比,进而推断出照片的具体拍摄位置。这种能力在某些情况下可能非常有用,比如在搜救行动中快速定位受困者,但同时也可能被滥用,侵犯人们的隐私。文章还提到了一位GeoGuessr(一款基于谷歌地图的游戏)的职业选手与GeoSpy的在线对决,结果显示,在多轮比拼中,AI的表现往往更接近于“标准答案”。然而,GeoSpy也并非完美无缺,它在某些情况下也会出错,比如倾向于将地点定位到某个城市,或者给出的经纬度与实际地点有所偏差。这也能让人松口气——尽管AI技术在不断进步,但仍有改进的空间。 但总的来说,GeoSpy的出现再次提醒我们,在享受科技带来的红利时,也要时刻保持对数据安全的警惕,防止不经意间的“自我暴露”。以下,Enjoy:本文经量子位(公众号 ID: QbitAI)授权转载,转载请联系出处
现在,AI只需随意一张照片,就能知道你在哪里,而且是可以精确到经纬度的那种!例如下面这张随便到不能再随便的自拍,你能猜到小姐姐在哪里吗?这事交给现在的AI来处理,它只需要“看”一眼,就能把照片里的“底裤都给扒出来”:美国,加利福尼亚州,旧金山机场洗手间,93号登机口附近……坐标:37.6189° N,122.3744° W
再如下面这张照片,AI根据湖的特征、树木和背景中的山脉,就匹配到了玛丽湖,同样是给出了精准的坐标:至于这个AI工具,则是最近由一位俄罗斯黑客所推出,名叫GeoSpy,号称是可以根据照片里的各种细节做分析来判断地理位置。包括光线、植物、建筑风格、天气,并将它们与大量街景/地理照片进行对比,据说也用到了地理空间视觉大语言模型的技术。而GeoSpy的功能,像极了此前一款基于谷歌地图的游戏GeoGuessr——游戏中会展示一张街景图,然后玩家要从地图上找到它的坐标位置;给出答案与正确坐标越近,分数越高。之前也有一位国外小哥(ID:georainbolt)凭借只需看0.1秒街景,就能在世界地图上快速锁定位置而在网络上蹿红。果不其然,斯坦福计算机系学生Andrew Gao在尝试了GeoSpy之后,就开始喊话这位小哥了:不过也有GeoGuessr的职业玩家坐不住了,站出来表示不服:人类 vs AI
这位挑战者,名叫做Gavin(下文我们简称“G哥”),是一位正在参与GeoGuessr 2024世界杯的职业选手。在第一轮对决中,G哥凭借抓到了马路道边上土耳其样式柱子的细节,判断这张图可能是在土耳其附近。结果显示,这张图里的位置确实是在土耳其附近,但距离精准的位置还差241km。G哥处理的方式是将截图“投喂”给AI,在静候了片刻之后,GeoSpy就给出了结果。然后G哥在地图中搜索这个经纬度,再跟GeoGuessr的“标准答案”做比较:第一轮的结果可以说是让G哥大受震惊,GeoSpy给出的位置比他的更近……在接下来的“火拼”中,G哥变得更加仔细,都凑近屏幕去捕捉细节了。G哥这次给出的答案是苏门答腊岛,但实际的结果却不是很理想,距离“标准答案”足足703km。到了GeoSpy这边,虽然大致位置都是在印度尼西亚,但这次给出的位置就没有那么准确了。不过比起G哥给出的答案,距离上却还是AI的答案更近些,这使得G哥开始有点无语子……在接下来的比试中,即便G哥把猜测距离压缩了86km,但GeoSpy给出的结果又是更接近于“标准答案”。然后G哥把头埋得更深了,当他捕捉到图中路边有文字时,脸上露出了得意的笑容:不过令G哥万万没想到的是,GeoSpy,它!识!字!这张照片是在波兰拍摄的,因为建筑物上写着“Abet”,这是一家波兰公司。
然而G哥还是觉得这把有希望,因为他发现GeoSpy只能定位到城市。所以这把如果AI给出的坐标是“标准答案”旁边的城市“华沙”,那么G哥就赢了。结果还真是……G哥也是露出了久违的笑容,并骄傲地说:(Emmmm……G哥,你非要这么算的话……也行。)G哥在下一轮的比拼中,将地图范围缩小到了自己的老家——芝加哥。这次在自己的地盘上,G哥的表现非常勇猛,有距离“标准答案”仅2m和4m的成绩。不过AI这边也是非常精准,起码在看图描述的过程中可以精确地说出周边的地址,这也让G哥着实捏了一把汗。但在地图上搜AI给出的坐标的时候,却比文字描述的地点远一些了,有的甚至还定位到了海上。但我也害怕这样的技术在未来5年后会迭代到什么样的程度。
也会频频翻车
其实在刚才G哥体验的过程,我们就能发现GeoSpy也存在一定的bug。例如它更倾向于把地点定位到某个城市,以及给出的经纬度坐标会跟文字描述的地点有偏差。以至于许多人开始怀疑这个GeoSpy到底是不是凭借所谓的“地理空间视觉大语言模型”技术。技术的发展虽然日新月异,但我们也要时刻警惕数据安全的问题;平常一定要注意,不然一不小心就可能被开盒。体验链接:
https://www.geoguessr.com/maps/61902b27f7af9400018aa89d参考链接:
[1]https://weibo.com/6444741184/OdDVBnynj#comment
[2]https://www.youtube.com/watch?v=FitqxvDuEIY
[3]https://www.reddit.com/r/geoguessr/
[4]https://twitter.com/WSXJPDD/status/1786728819446931488
[5]https://twitter.com/gregorycgravett/status/1785894800488583591
也许你还想看:
经纬徐传陞:做VC这么多年,人们总在问我同一个问题