扔掉小红书,国外自由行:Pokémon Go 和 Google Gemini 帮助打造最强旅游 Copilot
在现代旅游时代,传统导游面临着 Pokémon Go 和 Google Gemini 等创新技术的竞争。这些数字伴侣提供 7x24 全天候的可访问性、丰富的知识和个性化体验,改变了我们探索世界的方式。虽然传统指南可能会受到世界知识和可用性的限制,但 Pokémon Go 和 Google Gemini 可以根据个人兴趣无缝访问信息和建议。从发现隐藏的瑰宝到解开文化奥秘,这些技术丰富了旅行体验,为每一次旅程提供见解和陪伴。展望未来,大语言模型和增强现实的整合为沉浸式探索带来了更大的可能性,在不断发展的旅行领域弥合好奇心和理解之间的差距。在旅游大模型这个賽道有可能诞生出千亿美金的 AI 原生公司出来。
我是一个喜欢追求不同体验的互联网产品人,经历了 2G 时代的穷游,3G 时代的微博搭伙游,4G 时代的短视频推荐游。我在中国长大,随后在欧洲生活了两年,北美生活了 14 年,大部分旅游都是在国外。这篇帖子也主要探索科技产品加持下的国外旅游新方式。
随着技术的演进,我手上的旅游工具也慢慢有了变化:
2G 时代:《孤独星球》纸质书,诺基亚 Here Maps 离线地图,Wikitravel 离线版。
3G 时代:穷游网、马蜂窝看帖子做攻略
4G 时代:小红书、TikTok/ 抖音推荐
最近几年我对使用科技的感受是:推荐引擎太成熟,旅游博主太能吆喝,旅游马太效应越来越明显啦。不知不觉间,旅游开始“随大流”,无数的“打卡”点,“网红”地,“必去”清单把控着我。天哪,说走就走的冲动,随处漫步的惬意,我对旅游的初心逃不出推荐引擎的手掌心。
于是在最近一趟去越南河内和中国台北的旅行中,我尝试着摒弃推荐引擎,转而用了一些很特殊的科技与狠货:
用 Pokémon Go(精灵宝可梦 移动版)这款游戏带我探索世界
用 Google Gemini 大语言模型帮我介绍历史,解释旅游所见
这两款工具能代替专业的人工导游吗?这是我最想回答的问题。
《乔布斯传》里写到乔布斯夫妇去土耳其旅行,特地雇了当地大学的历史学教授当导游 -- 这样的旅行一定收获满满。可咱们普通人呢?是否也可以有类似的专人专业 1 对 1 的贴心服务呢?而且不花钱!
跟团游虽然有导游,但毕竟不是 1 对 1 服务,有时还会有暗示或者强制购物的不舒服。或许科技可以取人类导游之长,无不良导游之短呢?这篇文章带您揭晓我的体验和思考。
在越南河内的旅行中,我特意采用了两种旅游方式:
A. 雇佣了三位人类导游,每位导游都提供了独特的视角:
个人行:一位知识渊博的学生带我游览河内四小时。
跟团游:一位专业接待外国游客的导游,持有蓝色导游证。
商务行:一名专业的翻译带我了解河内的商业习俗和文化历史。
B. 用独特的科技工具自助游,同时不依赖小红书等推荐算法:
Pokémon Go – 利用游戏里的一个“靠近我的游戏”的功能帮助导航和发现附近有趣的地方。
Google Gemini – 借助生成式人工智(GenAI)来解释文化叙述历史。
最终我发现,大多数时候我更喜欢以 Pokémon Go、Google Gemini 为代表的数字伴侣。但是!它们也有局限性,少了一些人类导游的有趣和情感,同时如果没有网络那就巴比 Q 了。
在下面的文章中,我将分享我的反思和经历,并辅以旅行期间拍摄的图片。为了让文章更加完整,我首先将介绍生成式人工智能在旅行前规划的应用,但全文重点将主要放在旅行中导游。
随着数字时代继续彻底改变我们探索世界的方式,由大型语言模型 (LLM) 提供支持的生成式 AI 技术已成为旅行规划中的强大盟友。大语言模型提供的旅行前协助通常分为两大类:行程规划和计划执行。
在行程规划领域,大语言模型擅长制定全面的旅行计划,其中包括文化体验、美食、住宿选择和必去的旅游景点。例如,Google Gemini 的旅行行程推荐功能利用其先进的算法来根据个人喜好制定个性化旅行计划。
Google Gemini 的旅游行程推荐: 针对一家四口的家庭游,同时也提供了越南在四月份的天气概况帮助准备行前装备
微软家的 Microsoft Copilot 还提供专门的假期规划器叫做 Vacation Planner,进一步简化行程规划流程。这些工具分析大量数据,以建议最佳路线、活动和时间表,确保从始至终提供无缝且愉快的旅行体验。
Microsoft Copilot 甚至还有专门的假期规划程序。只是隐藏在 Copilot 中比较深,一般很难发现。
除了行程规划之外,大语言模型还能充当虚拟旅行社,协助旅行者进行各种选购活动,例如机票预订、酒店预订、汽车租赁和旅游安排。通过与第三方系统的 API 集成,这些由大语言模型支持的助手可以在网络上搜索相关信息并给旅行者建议。
例如,Google Gemini 与 Google Flights 和 Google Hotels 集成,为用户提供直接访问航班和住宿选择的机会。同样,ChatGPT 提供与 Expedia 和 Kayak 等平台的集成,使旅行者能够轻松搜索和预订旅行相关服务。
Google Gemini 通过其扩程序展(Extensions)提供旅行计划
OpenAI 的 ChatGPT 使用插件(Plugin)支持旅行前计划
值得说明的是,这些旅游规划助手有如下限制:
在规划上一般就是“第一下好使”,后面再继续深度询问就很难与前面计划的行程保持一致了。说实话我的感觉是不如看小红书马蜂窝等游记攻略自己总结。
在动作执行阶段,并没有真正做到“机票预订、酒店下单”。也就是最后一公里的执行问题还只能旅行者解决。
旅行前的周密计划无疑至关重要,但旅程本身也带来了一系列挑战和机遇。在接下来的部分中,我们将探讨 Pokémon Go 和大语言模型如何在旅行过程中继续支持游客,提供指导和见解,让大家自信而轻松地探索世界。
在旅行中我发现很多时候传统的语音导览设备和真人导游是可以被替代或增强的:
博物馆和美术馆常用的语音导览设备
有些场所为了创收会收取额外租赁费用。
语言选择也有限,一般是本地语言和英语。中文只有在非常大的地方或者中国游客非常多的地方才会提供,比如卢浮宫。
真人导游
真人导游通常知识面深而窄:对少数景点了解很多,对大部分景点了解有限。
真人导游有固定的行程,需要你遵循,不是“自由行”。
真人导游通常是单语或者双语,往往外国游客只能通过英文交流。
所以我用了两个很流行的手机 APP 帮我游览:
Pokémon Go:用来探索各种“打卡”点
Pokémon Go 是一层叠加在物理世界上的虚拟层,也是一款非常棒的增强现实游戏。它的游戏世界是整个地球,然后在各个风景名胜处放置了小怪物或者宠物小精灵让游戏玩家去探索。Pokémon Go 的创作者是 Google Maps 的创始人,因为苦于他儿子老是窝在家打游戏,而开发了一款鼓励青少年在户外活动的游戏。对技术范的读者插句题外话:Pokémon Go 的发布是当时世界上最大的 Kubernetes 集群应用(再跑题更远一些,对更老的技术范读者提问:世界上第一个成功的 Java 企业级应用是什么?)。
Google Gemini:利用大语言模型的多模态(文字、语音和视觉)充当游客的眼耳脑
Google Gemini 不光是一个大语言模型,同时也支持图片输入。它有一个很好用的手机 APP,接受三种输入方式:文字、语音、和图片。这样游客可以随时提问,一边游览一边与 Gemini 互动获取更多的旅游知识。
在接下来的部分中,我将说明这一创新系统如何增强旅行体验。在旅行过程中,传统的语音导览设备和真人导游可以被 Pokémon Go 和 Google Gemini 取代或增强。
作为世界上玩家最多的增强现实游戏,Pokémon Go 已经超越了其游戏娱乐的本体,而成为了一个强大的世界探索工具。这个有点像 Google Earth(谷歌地球)和 Google Street View(谷歌街景),用户可以足不出户“浏览”整个世界。当然,Pokémon Go 的核心是让游戏玩家走出家门,真正探索物理世界。
Pokémon Go 也开始说是一个“众包“平台,或者 UGC(User Generated Content)平台。其吸引力的核心是 PokéStops 和 Wayspots,也就是大家经常说的“打卡点”(POI: Point of Interest)。它们是通往现实世界兴趣点的门户,吸引旅行者踏上人迹罕至的发现之旅。
Wayspots:游戏玩家和社区驱动的兴趣点
Wayspots 是玩家在 Niantic 游戏(例如 Pokémon Go 和 Ingress)中提交的真实世界位置。它涵盖了各种各样的景点,包括历史地标、雕塑、公园和建筑奇观。玩家只要拍照,然后提交到游戏平台,待平台批准后就可以变成游戏中人人可以获取的游戏景点。
PokéStops:官方发布的游戏地标
PokéStops 源自已获批准的 Wayspots,是 Pokémon Go 中的游戏内置地点,也是互动和探索的中心。一般 PokéStops 是比较大的兴趣点,会有各种小宠物,玩家会在这些经典打卡地进行各种 battle。
这两款程序在国外的 Google Play Store 和 Apple AppSotre 都可以免费下载和使用。介绍完这两款程序,我们一起开始旅程探索世界吧~
河内还剑湖周围的 Pokéstops 和 Wayspots 路径点(左),以及湖中央著名的龟塔(右)-- 真的有乌龟哦!
往往大景点都是 Pokéstops,附近也有很多 Wayspots 路径点。还剑湖 (Hoàn Kiếm Lake) 是河内必去的旅行景点和经典,而且一到周末,周围一圈的街道就禁止机动车上路了,专门留给行人、游客和锻炼的人。大多数游客都被湖中心标志性的 龟塔(Tháp Rùa)吸引,然后径直走过去。但其实呢,好的风景在途中,而不止在终点。途中有很多鲜为人知的景点往往被心急的游客或者传统导游忽视 – 可 Pokémon Go 一点都不会落下!
前往还剑湖 (Hoàn Kiếm Lake) 途中的三个 Pokéstops,每一个都有一段历史和故事
Pokémon Go 使用名为 Wayfarer 的系统来管理 Wayspots 和 Pokéstop 的提交和编辑。该系统允许玩家通过提名新的 Wayspots 并审查其他人提交的内容来做出贡献。PokéStops 和 Wayspots 的壮大归功于游戏社区的积极参与。通过玩家的共同努力,从 2019 年 11 月到 2020 年 6 月短短七八个月时间,游戏里就新增了 190 万个 Wayspot 。
所以,当你在国外一个陌生的城市 city walk 时,下载打开 Pokémon Go,一边玩游戏收集宠物小精灵,一边游览游戏景点吧!
我在用 Pokémon Go 的过程中,心里四个字一直在呐喊:什么是“寓教于乐”?这不就是嘛!
Pokémon Go 带我们去了旅游景点,可谁为我们讲解呢?在下一节中,我们深入探讨如何用 Google Gemini 做导游。
PokéStops 和 Wayspots 是探索“我附近”(Near Me) 的兴趣点的最佳方式,这些兴趣点通常是导游不知道的或 Google 地图不显示的。
Gemini (“双子座”)是 Google 为了对抗 OpenAI 推出的多模态大语言模型。其实作为人工智能的先行者,Google 早就有尝试各种 AI 助理。在 Gemini 之前还有最早先的 Google Assistant(主要用在智能家居 Google Home,安卓手机,和车载系统 Android Auto),屌炸天但没有大规模应用的 Google Duplex(发布的时候绝对是一枝独秀,那时候大家还认为 Google 是 AI 领头羊),一脉相承但是昙花一现的 Duet AI(对标微软的 Copilot 全家桶),以及命苦且短命的 Bard:匆匆上马然后直接被 Gemini 完全取代。Google 从领先者变成了追随者。
可 Gemini 还是很好用,尤其是对多模态和中文支持也不错。当然,重点来了 – Gemini 是唯一支持图片输入的免费大语言模型 APP。
大家有没有注意到前图右三中巨大的钟表?我在 Pokémon Go 中看到它的时候还非常纳闷:怎么一个巨大的石头做的钟表反而成了地标了?Pokémon Go 只是带我去了那里,但是没有解释为什么要去那里。然后我就打开了 Google Gemini 开始询问了。
Google Gemini 对鲜为人知的瑞士钟表娓娓道来,同时中文也支持。注意右上角的语音按钮,可以用来听的。
上图所示的还剑湖附近瑞士钟的故事正好回答了我的问题:
瑞士钟是瑞士城市 Bern 在 2010 年 1000 年生日的时候赠送给河内的,直径足足有 13 米,高 1.8 米,其实是挺大一个东西,但是没人知道!
这个瑞士钟鲜有人知,很多河内本地人也不太知道,这可怎么办?Gemini 解释说有很多人一直在抱怨政府没有做好宣传(压力瞬间给到河内文旅局)。即使是专业导游或当地人也可能不知道其历史。因此越南当地人一直在讨论将时钟重新安置到更显眼的位置。
瑞士钟其实在谷歌地图上根本找不到!但《Pokémon Go》显示了它的位置!
瑞士钟其实只是去往还剑湖的一个途中小插曲,最终目的地还剑湖也有一个美丽的传说,Gemini 用其独特的女声(也可以选男声,谁叫咱叫“双子座”呢)娓娓道来。
还剑湖的传说
一边走,一边听,Google Gemini 揭示了还剑湖的有趣起源,还生动地描绘了一把传奇宝剑和发生关键作用的神龟的历史:一位越南古时候的国王得到了神龟亲赐的宝剑,击败了外来入侵者(你们猜是谁?),最后又把宝剑归还给了居住在湖中的神龟,“还剑湖”之名由此得来。
Google Gemini 讲述还剑湖和神龟的故事——这个河内的淡水湖就是过往归还宝剑的地方。
作为旅行伴侣,Google Gemini 的与众不同之处在于它能够提供超越传统导游局限的见解。能够做到胸中有物,知无不尽。有了 Gemini,我能够更深入地了解周围的历史和文化,发掘隐藏的瑰宝和不为人知的故事,丰富旅行体验。
Google Gemini 比专业导游更能讲解世界。
此外,Google Gemini 的手机 APP 有对用户很友好的界面设计和直观的功能(例如文本转语音),为移动探索提供了无与伦比的便利。
我一般是用无线耳机跟它配合使用,边走边问,边问边听。这个时候 Gemini 就变身为一个移动中的动态音频指南,不让我做低头族而耽误了旅途中的美景和风土人情。
具有 Google Gemini 文本转语音功能的真无线耳机是最好的移动旅行指南,也是增强现实在旅游业中的绝佳应用。
彩虹屁一把:在不断发展的旅游技术领域,Google Gemini 犹如启蒙灯塔,以其无尽的知识和深刻的评论照亮世界。从揭开鲜为人知的地标之谜到探究塑造文化遗产的传说,Gemini 已不再只是单纯的向导,而是成为深入了解我们周围世界的门户。随着我们继续探索增强现实的边界,Gemini 成为一股变革力量,通过一次次的旅行和一笔笔的讲解,精雕细琢逐步塑造旅游探索的未来科技形态。
上面一整段话,除了前 5 个字,都是 ChatGPT 润色的。大语言模型如 ChatGPT 和 Google Gemini,一点都没有人类的嫉妒之心,虽然贵为势不两立的竞争对手,但相互吹捧起来其实是一点都不含糊的,而且它们说话的时候也是真心实意的 -- 因为机器不会撒谎,只会幻觉(hallucination ),也就是一本正经地胡说八道。但是重点来了:再胡说八道,也是真心实意的 ——已婚男人们都学起来吧。
当初为了抗衡只有文本能力的 ChatGPT,Google Gemini 一定要有创新,于是成为了首个支持多模态的大语言模型。所谓“模态”,其实就是沟通交流的媒介,如文字、声音、图像、视频,还有前卫玄乎的脑波。“多模态”就是一个模型同时支持多种沟通媒介。例如正常人就是多模态的,耳朵眼睛触觉分别代表不同模态。聋哑人是双模态,主要是看和摸。盲人也是双模态,主要是听和摸。
在我参观河内最古老的佛教寺庙镇国寺时,我看到了一个有趣的场景:好多游客肩搭着肩围绕着一棵参天大树绕圈圈。他们在干嘛?没人可以问,于是我求助于 Google Gemini:为什么这些人要绕着这座佛教寺庙里的树转圈?见下图:
Google Gemini 解释寺庙里绕树的仪式
首先,Gemini 仅凭一张照片(上图左)就成功识别出这座寺庙是越南河内的镇国寺!是不是很棒?我看到答案时直接惊呆了 -- 这得要多上通天文下晓地理才能有如此广泛的知识面!然后它继续解释了绕圈圈的几种原因。还让我很惊叹的是,把树围起来的坛子上其实是有一些被游客遮挡的文字的,可 Gemini 仍然成功辨认或者推理出全部文字:“DUONG LICH”、“CHÍNH NGHIỆP”和“CHÍNH”。
在整个行程中,我的两个经常性动作是:
走路的时候就用无线耳机跟 Gemini 对话,让它讲解整个越南的历史,从发源讲到成为中国的藩属国,然后经历了法国和日本的殖民统治,再到胡志明领导的独立运动,然后越南战争和有越南特色的社会主义。还解释了河内为什么叫“河内”,真的就是城市被河包裹,所以叫河内。
遇到语言无法形容的,就掏出手机照一张相,然后找 Gemini 解释。一来一去一问一答倒也有趣,虽然一个人旅行,但总感觉有专人陪伴,而且 Gemini 还可以设置自己喜欢的声音哦。
我发现 Google Gemini 非常擅长翻译和识别照片中的物体,但有时它拒绝识别或评论照片中的人。唉,谷歌那水漫金山的政治正确,跟微软的”Responsible AI”一样泛滥而且副作用明显。Google 曾经犯过一些很“致命”的错误,比如把黑人识别成大猩猩,结果一朝被蛇咬十年怕井绳,产品经理或者决策者们干脆采取了“宁可错杀一千也不放过一个”的“宁滥毋缺”策略,严重影响了绝大多数人的产品体验。
随着 Google Gemini 的不断发展,它逐渐成为我进行基于图像的查询的首选工具,并逐渐取代了 Google Lens 作为我图片识别的首选。
有一天我和导游去了河内的一家咖啡馆(Gemini 也可以解释为什么以茶为主导的亚洲,咖啡在越南如此流行)。来了这里总要体验一下世界闻名的越南鸡蛋咖啡吧!然后我就开始一边跟导游对话,一边从 Gemini 上求证。我发现在短短 10 分钟的对话里,导游传递了一些错误的信息,也有一些不太清楚的问题,而 Gemini 正好是一个很好的辅助。
鸡蛋咖啡的准备其实是很漫长的,因为要把淡黄打发到起泡,才能有绵密细滑的口感。有点像做蛋糕的时候手打蛋黄,两根筷子是很难搞定的。于是咖啡厅里一般用电动打蛋器。但即使这样,也需要打发至少 5 分钟才能有非常绵密的泡沫。这也解释了为什么鸡蛋咖啡在世界范围内不如奶泡咖啡流行 – 制作工艺有点复杂。
然后我的小小好奇心就起来了,我问导游:在电动打蛋器发明之前,越南人是如何打发蛋黄的呢?这一下子就把他给问住了。我的导游不到 30 岁,而鸡蛋咖啡的历史已经有七八十年了,好像从他小时候的记忆里鸡蛋咖啡就是用电动打蛋器做出来的。
要回答这个问题,必须要有 3 个推理过程:1)鸡蛋咖啡杯发明的时候,电动打蛋器被发明了吗?2) 如果是,那电动打蛋器在越南有引入并广泛使用吗?3) 如果否,那越南人用什么呢?我的当地导游没有把这个思考过程联系起来。但 Google Gemini 却给出了直接的答案:
Google Gemini 解释了越南鸡蛋咖啡中蛋黄的加工过程
1)鸡蛋咖啡杯发明的时候,电动打蛋器已经被发明了。
2)但是早期的电动打蛋器并不好用,也没有引入到越南。
3)所以越南人早期一直用手动打蛋制作鸡蛋咖啡。
越南导游还告诉我,鸡蛋咖啡很卫生,因为在打蛋的过程会把蛋黄做熟起到杀菌作用。而 Gemini 则指出,其实这有一定的健康风险,因为搅拌产生的热量不足以完全煮熟蛋黄,也不一定杀菌。嗯,我的下一个问题很自然的变成了:使用无菌蛋呢?真的无菌吗?Gemini 不光能从科学角度给出合理解释,还会考虑经济和社会因素。比如无菌蛋的成本是否会成为阻止鸡蛋咖啡流行的障碍。
在咖啡馆里,我不断地追问导游为什么鸡蛋咖啡没有牛奶咖啡那么受欢迎。Gemini 满足了我有点变态的求知欲。我相信大多数导游不会有如此广泛的知识或极大的耐心来回答我这些古怪的问题。
大语言模型既有知识,又有耐心,可以提供对旅游中问题的全方位解读和回答。
与任何技术一样,Pokémon Go 和 Google Gemini 都有自己的一系列限制,可能会影响它们在某些情况下的有效性。
对互联网接入的依赖
Pokémon Go 和 Google Gemini 的主要限制是它们对互联网连接的依赖。在没有互联网接入的地区,例如偏远的荒野或地下,这些技术可能会变得无效,从而限制了在人迹罕至区域的探索应用。
室内限制
尤其是 Pokémon Go 主要针对户外探险而设计,在室内环境中基本无法发挥作用。因此,在博物馆、美术馆或其他室内景点寻求指导或信息的游客可能会发现 Pokémon Go 作为旅行伴侣的实用性有限。
在移动互联网普及之前,我会把整个 Wikitravel 网站下载到手机上离线阅读游览城市的 HTML 页面。从这个意义上说,我手中的《孤独星球》(Lonely Planet)或 Wikitravel 的离线副本就是我的本地导游,只是它们只能浏览,不能对话,产品体验比大语言模型差很多。
虽然现在已经有了 0.5B 到 2B 离线手机版本的大语言模型,但他们也有非常多的局限。比如说这些离线模型缺乏世界知识。因为参数太少了,也不能上网寻求知识补全。同时大语言模型对手机硬件的资源要求也让中低端手机捉襟见肘。本地算力跟不上还是只能依赖联网体验。
在博物馆等环境中,文物识别也有局限性。因为大语言模型参数再多也不能具体到每一个很小的展览品,所以传统的博物馆导游和导览设备会提供更卓越的讲解知识。
最终,虽然 Pokémon Go 和 Google Gemini 等技术提供了前所未有的便利性和可访问性,但它们少了人与人近距离交互的人情味。它们更多的是一个专业知识的讲解员,开个玩笑,来个段子,即兴表演一个,这些都是人类导游做的好而科技无法追上的地方。
总结一下,在旅行陪伴领域,Pokémon Go 和 Google Gemini 是革命性的工具,为全球旅行者提供无与伦比的可访问性、知识和便利性。通过利用增强现实和高级语言处理的力量,这些技术重新定义了传统的导游体验,根据每位旅行者的独特兴趣和偏好提供个性化的旅程。它们的优点主要体现在:
拓展知识视野
传统导游最显着的缺点之一在于他们的世界知识有限。然而,有了触手可及的 Google Gemini,旅行者就可以访问海量信息库,并通过从广阔的互联网收集的实时更新和见解来丰富信息。无论是寻找历史轶事还是文化细微差别,Google Gemini 都是无所不知的向导,随时准备用其无限的知识照亮道路。
不间断的可用性
与传统导游的可用性和能力可能受到时间和资源的限制不同,Pokémon Go 和 Google Gemini 提供全天候帮助,确保旅行者可以随时获得答案和建议,而无需等待或安排预约。这种无缝的可达性增强了旅行体验的灵活性和自主性,使旅行者能够按照自己的节奏进行探索。
量身定制的建议
Pokémon Go 和 Google Gemini 有潜力提供高度个性化的体验,并根据每位旅行者的独特兴趣和偏好进行策划。通过复杂的算法和用户反馈机制,这些技术可以提供有针对性的推荐,引导旅行者前往隐藏的瑰宝、当地热点和与个人品味产生共鸣的景点。
丰富的文化沉浸
通过集成笔译、口译和文化解说功能,Pokémon Go 和 Google Gemini 促进了更深层次的文化沉浸,使旅行者能够更深入地与周围环境互动。无论是破译当地习俗、克服语言障碍,还是解开历史谜团,这些技术都是不可或缺的伴侣,通过有意义的见解和理解丰富旅行体验。
不断发展的旅行应用程序
展望未来,大语言模型和增强现实技术在旅游应用中的融合想象空间非常大。从观光推荐到实时翻译服务,这些创新解决方案有可能彻底改变旅行者探索和与周围世界互动的方式。通过利用大语言模型和“我附近”的景点,旅行者可以踏上由知识、好奇心和陪伴引导的沉浸式旅程。
无尽的探索
在不断发展的旅游技术领域,Pokémon Go 和 Google Gemini 为未来铺平了道路,让旅行者不再孤独。有了大语言模型的支持和增强现实的陪伴,每一次旅程都变成了一次冒险,每一个目的地都变成了一次发现,每一个时刻都变成了探索和启迪的机会。
在我写下最后这一段时,OpenAI 刚刚发布了 GPT-4o – o 代表的就是全通路 (Omni-channel)和多模态:语音、文字、图像同步支持,而且时延小到让人不觉得有顿挫感。如果我们把 GPT-4o 再配上手机 App,无线耳机,或者 AR 眼镜,未来的旅行者会有一个前所未有的体验。技术已经成熟,就看哪家公司跑得快了!
美国从电话发明到互联网普及之间的近一百年的时间里,有个非常大的职业群体叫旅游代理(Travel Agent)。顾客浏览邮筒里寄过来的纸质旅游指南,然后打电话给旅游代理订机票,订行程,订酒店。旅游代理就像房产经纪人一样活得风生水起。
后来移动互联网普及,Expedia/ 携程革了旅游代理的命,导致这个行业迅速萎缩,转而提供高端定制或金融服务。而 Expedia/ 携程这类公司,互联网基因为重,它们的商业模式严重依赖于资源聚合(也就是 Aggregator 商业模式),搜索引擎,和推荐引擎。它们无法提供对每个游客的贴心服务,也无法面面俱到到旅游过程中的切身体验。这些反而是传统旅行社比较擅长的。
互联网和移动互联网其实从没有解决旅游的最后一公里问题。大语言模型,尤其是旅游业的大语言模型,在游客好奇心的引导下,在更高旅游体验的强烈要求下,会成为一股摧枯拉朽的变革洪流去推翻去 disrupt 上一代互联网巨头们。将来的旅行者,会用最少的价钱得到乔布斯花高价雇佣历史学教授游览土耳其的高端体验。《孤独星球》将慢慢退出历史舞台,旅行者和他们的地球目的地都将不再孤独,因为他们有旅游业大语言模型和口袋怪物 Pokémon 的陪伴。一些 AI 原生的旅游业创业公司会成为新的巨头,在全球旅游的大市场下,成长为千亿美金的破局者。
姚旭晨 Seasalt.ai CEO,自然语言处理和人工智能领域的专家和创业者。本科毕业于南京大学电子系,硕士在荷兰格罗宁根大学(自然语言处理和统计学)和德国萨尔兰德大学(计算语言学),并于美国约翰霍普金斯大学取得博士学位,主要致力于机器学习领域的自然语言处理和语音技术研究。论文在自然语言理解和机器学习的顶级会议上多次发表。曾创立了语音唤醒和自然语言交互公司 KITT.AI,致力于语音唤醒和自然语音交互技术的研究开发,公司曾被 CBInsights 评选为首届 AI 100 公司,并获得微软联合创始人保罗·阿兰旗下的阿兰人工智能研究所、亚马逊 Alexa 基金等投资。
随着大型 AI 模型在企业中的应用日益广泛,为了助力企业更好地把握 AI 技术的最新趋势和实践,InfoQ 将于 8 月 18 日至 19 日在上海举办 AICon 全球人工智能开发与应用大会,目前我们设置了端侧模型落地探索、大模型训练以及推理加速、大模型数据集构建及评测技术落地、大模型安全性实践、RAG 落地应用与探索、AI Agent 技术突破与应用、多模态大语言模型的前沿应用与创新、大模型场景 + 行业应用落地实践、大模型工具链与企业提效实践、大模型在搜索、广告、推荐领域的探索、大模型产品应用构建、大模型产学研结合探索等话题。我们将邀请企业专家来为你分享当前的最新前沿实践,期待能够为参会的听众取得先发优势。
现在大会已开始正式报名,6 月 30 日前可以享受 8 折优惠,单张门票节省 960 元(原价 4800 元),详情可联系票务经理 13269078023 咨询。
德国再次拥抱Linux:数万系统从windows迁出,能否避开二十年前的“坑”?
一次性裁掉 50 多名副总裁!小扎的冷血管理哲学:高管也是打工人
微信扫码关注该文公众号作者