让罗翔“一夜变老”?AI视觉技术还有多少可能?
作者丨星影
编辑丨Ella
来源丨[All in AI丨人工智能范式变革]课程开展先导公开课
普法“段子手”罗翔一夜变老了?
近日,网络流传普法“段子手”罗翔教授“头发全白、容貌苍老”的照片,引发广泛关注。11月14日,罗翔教授发布题为《看我被“白头”,很多亲友发来慰问,还有对错真假吗?》的视频,亲自辟谣,澄清该照片是有人故意使用软件P出来的。
此事引发了网友对于AI变脸技术是否侵权的讨论。罗翔教授指出,这个问题的关键在于主体是否认可。
网红、名人被AI换脸事件屡见不鲜,人们不禁开始思考,未来的人工智能如何规范使用?更有网友开始好奇,AI视觉识别技术又将被应用在哪些意想不到的领域?
在第三代人工智能的浪潮中,视觉识别技术正在引领行业变革的风暴。通过先进的算法,我们可以打造出近乎真人的虚拟形象和网络红人,使得全球社交媒体见证本土名人以外语发声、欧美网红口吐流利中文的奇观。
AI视觉技术在内容行业引发的热潮,让大众意识到人工智能潜在的技术能力。
与此同时,被誉为智能代理的AI实体正在受到全世界科技巨头的青睐。今年10月,谷歌和亚马逊相继推出了颇具革命性的AI产品。这些人工智能体不仅能够有效执行任务交付,还能在人力资源紧张之际,自发负担起工作的重担,成为人类事业的得力助手。
专业领域内,如何提升视觉识别效率、扩大商业应用范围,已成为投资者和创业者热切关注的话题。那么,当前AI视觉技术有哪些标志性的技术突破?现在是否是加码AI的最佳时机?
在AI技术重塑千行百业的时代背景下,让我们一同探寻顶级学者眼中的AI视觉技术发展前沿和AI2.0时代下的商业新范式。
↖ 点击右上角收听全文,精彩内容尽收耳底 ↗
超越人眼:AI如何通过深度学习驾驭复杂图像识别?
最近,一段由著名小品和相声艺术家“飙英语”的视频引起了公众的广泛关注。根据11月5日的央视报道,视频网站可利用人工智能换脸技术,使国产影视剧的角色用英语对白呈现,通过换脸小程序,人们也可以将自己置换为电影中的角色。
这项新技术带给人们欢乐的同时,也激发了公众对于背后技术的深思。
AI换脸是Deepfake技术中的一种,Deepfake包括以图片形式存在的脸部替换、以音频形式存在的声音替换以及影像中面部与声音的同步替换。
Deepfake中的“deep”指“深度学习”。这种基于神经网络的机器学习方法能够模拟人脑结构和功能,通过大规模数据的训练和自动优化算法,从数据中学习并提取高级抽象特征。
一项经典案例充分展示了人工智能深度学习的巨大潜能。
2019年,一位Netflix工程师进行了一项研究,通过对100部具有代表性的好莱坞电影进行分析,手动为电影片段添加了“亲吻”或“非亲吻”的标签。该工程师利用静态画面和声音数据,对AI进行了深度的学习训练,最终准确地实现了亲吻场景的识别。
这项研究的发现强调了“精心挑选的数据集”在训练检测系统中的重要性,使系统能够利用更多上下文信息进行识别,而不仅仅依赖于静态图像或标签。
此后的几年中,这项技术在YouTube的视频审核中展现了卓越的效能。
现代人工智能视觉识别技术融合了计算机视觉、模式识别以及深度学习等尖端算法,赋予机器通过视觉输入识别物体、人脸、场景和行为等多样视觉元素的能力。
借助AI算法驱动的智能分析系统,许多产品现已能通过“多轴人脸检测跟踪”等技术,在复杂、低分辨率的影像及大规模人群监控场景中实现高精度的人脸识别。
在此过程中,AI技术可实施毫秒级的人脸检测,并轻松克服侧脸、遮挡以及模糊等实际环境所带来的挑战。
AI视觉识别技术之所以取得迅猛发展,得益于庞大而精确的数据库的强力支撑。而视觉识别技术的不断优化,显著提升了AI在各个领域的应用效能。
当前,这项技术已广泛应用于安全生产、公共园区、智慧食品安全、智慧城市管理等多个场景,并预期在安防监控、社交媒体、政府服务等领域拥有更广泛的应用未来。
不断迭代的技术不仅极大提高了相关领域的工作效率,也在显著降低企业运营成本方面发挥了重要的作用。
正如袁培江教授所说,“随着深度学习算法的持续进化及ChatGPT等尖端技术的整合,人工智能视觉识别技术将实现显著的性能提升。未来的图像识别技术将摒弃依赖传统金字塔模型的方法,转而采用创新的训练策略,这一转变将在提升识别准确性和处理速度方面取得显著成效。”
AI智能体新纪元
超自动化时代即将到来
在2018年6月28日,中国科学院院士张钹首次提出了第三代人工智能的概念,这一概念的核心在于构筑和阐释能够被理解并且具有高鲁棒性的人工智能算法。此提议不仅指明了基础理论研究的新方向,而且对人工智能技术的未来发展趋势作了预示。
目前,AI视觉产品的能力已足以满足消费者对个性化服务的需求,并在传统制造业中大幅提升了生产效率。预期在未来,人工智能将作为第三代工人,彻底改革某些传统制造业的生产流程。
在人工智能浩如烟海的应用案例中,国产大型客机C919的量产备受瞩目。
在飞机制造中,装配工作量占据了整个制造过程的30%~45%。铆接作为一种常见的连接方式,提高连接孔的质量对于飞机的结构强度、使用寿命和性能至关重要。
在C919的量产中,AI技术被应用于开发航空制孔机器人系统,以实现飞机部件的自动化制孔。同时,深度学习技术在飞机喷涂、外壳精密打孔等领域的应用,也使得国内相关技术在全球范围内处于领先地位。
在经历了第三代AI的发展阶段后,人工智能将进入“AI Agent”智能体的新阶段,这预示着超自动化的未来发展。自主智能体将进入“认知智能”领域,在大规模模型的基础上,结合视觉识别技术与行业知识大数据,有望将AI的认知能力推向新的高度。
许多媒体和资本市场认为,现在是在人工智能领域投资和创业的最佳时机。然而,袁培江教授提到,“无论是投资还是创业,都需要首先找到自己的相对优势,并了解人工智能技术的局限性。”
以无人驾驶为例,尽管该领域技术进步迅速,但仍然存在诸如传感器、计算机视觉、高精度地图和人工智能核心的数据处理与算法设计等技术瓶颈。
即便是年初爆火的ChatGPT,也有大部分无法应对的需求,AI技术未来的发展潜力仍然巨大。因此,AI领域的投资需要根据实际的使用频率和开发成本来预估市场效应。
埃隆·马斯克认为,人形机器人可能是通用机器人的最终形态。在制造业领域,通用机器人和AI技术无疑将取代一部分人力。
随着深度学习算法的发展和像ChatGPT这样的尖端技术的整合,AI视觉识别技术的性能正朝着更高的精度和速度迈进。强大的数据库支持和算法设计正在推动AI技术突破传统模型的限制,将AI智能体的认知能力推上新的巅峰。
袁培江教授相信,未来的机器人将成为一个多方面逐渐成熟的综合体,虽然在执行力、决策能力和计算能力方面将远超人类,但在灵活性、迁移性和泛化性方面可能不及人类。
因此,我们这一代人需要学习人工智能,适应人工智能,以便在未来与AI和机器人和谐共生。
AI技术浪潮引发了全行业的科技范式变革,孕育着巨大的市场机遇。如何全面掌握AI领域前沿知识图谱,打通AI领域技术、应用壁垒,是未来产业领袖前瞻布局发展高地的关键。
四为高管教育持续关注中国产业的转型升级和未来商业模式重构,在AI范式变革浪潮来临之际,精心打造[All in AI人工智能范式变革]课程。课程于变局中开新局,整合AI产业及科技领域全球资源,通过聚焦AI赋能,深度洞察多元应用场景下AI产业创新趋势,探索AI2.0时代商业新范式,培养兼具智慧科技思维与产业深刻洞见的AI战略家。
四为高管教育
四为致力于成为全球高管教育领域的创新典范。我们与中国产业转型升级共成长,与终身学习的企业家同行,持续关注未来商业重构和跨学科知识整合的机会,连接全球优质商业教育资源,打造极致学习体验。为新一代企业家、创新者和管理者提供顶层全览和前沿洞见,助力商业新实践和新范式的探索,共建中国商业文明和世界的价值连接。
自 2019 年创立以来,四为已开设十余个高管教育公开项目,覆盖健康、消费、金融、科技、 能源等行业领域。
微信扫码关注该文公众号作者