最近有个甲方大大老板微信问我:“你们产品用的是微调还是RAJ”,我一下子懵了。AJ我认识,RAG我也知道,可RAJ是个啥?新概念?还有个关系很好的老大哥,总把Prompt说成Promote。关键嗓门还特别大,外面跟领导们高谈阔论的时候,尤其爱讲英文词。私底下纠正过他一两次,大哥虚心接受,还竖个大拇指:“胡兰克你们年轻就是厉害!”然后他还是见人就说Promote,也时常介绍“方吞”(fine-tune),说到一半,就让“胡兰克”帮他再详细讲讲。不过好在,政府、国央企的领导们,非常谦虚,听了都连连点头,笑着说自己的英文也就和雷军不分伯仲、Are U OK的水平。领导们听完,也竖个大拇指,说,“你们懂海外技术的就是厉害!”后来我有经验了,和大哥聊天,就他念他的、我念我的,反正“听着都一个样”。类似于是“福建”还是“胡建”,“掀起波澜”还是“掀起po澜~”,不影响理解,自己人随便怎么念也都无所谓。毕竟就像维特根斯坦说的,“语言的意义在于其使用”。只是,又总想起维特根斯坦说的另一句,“你用什么语言表达,你就用什么语言在思考”。当我用缩写或者翻译表达的时候,我的理解天然就被“蒸馏”过了。所谓AI Native的一些应用,在Non-native的语言环境、知识结构里,大概率做起来会很艰难。读论文也有这种感觉,回归词义本身。把合起来的词先拆开、把基础的概念先回顾一下,再细读文章,常有种自我进化的感觉,仿佛用1小时模拟了实验室里1年的进展。沿着论文Introduction的思路,不看正文,先从一个定义、一个概念、一个词出发,在脑海中尝试去推演。带着疑问模拟一下,再去读正文,理解就事半功倍了。还有个发现,很多开发者,对RAG、NLP之类的缩写非常熟悉,但是所代表的单词、字面意思完全说不上来。(用这个方法可以很容易鉴别真实的论文阅读情况)。
想到整理《AI黑话辞典》,一方面是我自己读文章、做产品的需要,另一方面也想分享给喊我胡兰克的好大哥。更重要的,还是想给有机会用到这些“黑话”的朋友们,作一个小小的参考。
麦肯锡有种快速深入了解一个行业的方法,就是先找200个有理解门槛的关键词,弄懂这些词后,再去访谈,很快就能和业内人士谈笑风生了……今天是《AI黑话辞典》的第一次营业,我已经整理了300多个词,就是太多了一次放不下,分批奉上。随着新论文、新技术、新产品的诞生,相信一定还会持续更新。
我把飞书表格版本的链接放在文末,想要更完整阅读体验的,欢迎自取!!
一、基础概念
AI(Artificial Intelligence):人工智能,模拟人类智能的技术。比如:百度的文心一言。
ML (Machine Learning):机器学习,通过算法从数据中学习。比如:阿里达摩院的机器学习研究。
DL (Deep Learning):深度学习,使用神经网络进行复杂模式识别。比如:腾讯的深度学习平台。
NN (Neural Networks):神经网络,模仿人脑神经元结构的算法。比如:智谱AI的神经网络模型。
Algorithm:算法,用于解决问题的步骤和规则。比如:快手的视频推荐算法。
LLM (Large Language Model):大语言模型,用于自然语言处理的大型模型。比如:OpenAI的GPT-4。
Fine-Tuning:微调,通过额外训练优化模型。比如:抖音的个性化推荐系统。
Transfer Learning:迁移学习,利用已训练模型的知识进行新任务。比如:百度的图像识别系统。
RAG (Retrieval-Augmented Generation):检索增强生成,通过检索数据辅助生成内容。比如:DeepSeek的检索增强生成模型。
10.RL(Reinforcement Learning):强化学习,通过奖励和惩罚优化行为。比如:阿里达摩院的游戏AI。三、数据处理
11. Data Preprocessing:数据预处理,准备和清洗数据的过程。比如:蔚来汽车的自动驾驶数据处理。
12. Feature Engineering:特征工程,创建和选择模型输入特征。比如:滴滴的乘客特征分析。
13. Data Augmentation:数据增强,通过变换扩充数据集。比如:MiniMax的数据增强技术。
14. Data Labeling:数据标注,给数据加上标签。比如:月之暗面的数据标注平台。15. Data Normalization:数据归一化,缩放数据到统一范围。比如:智谱的图像处理技术。四、自然语言处理
16. NLP (Natural Language Processing):自然语言处理,理解和生成人类语言。比如:阿里的达摩院NLP实验室。
17. NLG (Natural Language Generation):自然语言生成,生成自然语言文本。比如:腾讯的智能写作工具。
18. NER (Named Entity Recognition):命名实体识别,识别文本中的实体。比如:抖音的文本分析系统。
19. POS Tagging (Part-Of-Speech Tagging):词性标注,标注文本中的词性。比如:快手的文本处理工具。
20. Sentiment Analysis:情感分析,分析文本中的情感倾向。比如:智谱的情感分析平台。
21. CV (Computer Vision):计算机视觉,处理和理解图像。比如:百度的图像识别系统。
22. OCR (Optical Character Recognition):光学字符识别,识别图像中的文本。比如:腾讯的OCR技术。
23. Object Detection:目标检测,检测图像中的目标物体。比如:阿里的自动驾驶系统。
24. Image Segmentation:图像分割,将图像划分为多个部分。比如:蔚来汽车的自动驾驶图像处理。
25. Face Recognition:人脸识别,识别人脸信息。比如:滴滴的乘客人脸识别系统。
六、语音处理
26. ASR (Automatic Speech Recognition):自动语音识别,将语音转换为文本。比如:百度的语音识别技术。27. TTS (Text-To-Speech):文本转语音,将文本转换为语音。比如:阿里的智能语音助手。28. Speaker Recognition:说话人识别,识别说话人的身份。比如:腾讯的语音识别系统。29. Voice Synthesis:语音合成,生成自然的语音。比如:抖音的智能语音合成技术。30. Speech Enhancement:语音增强,提升语音质量。比如:智谱的语音处理技术。七、推荐系统
31. Recommendation Engine:推荐引擎,提供个性化推荐。比如:抖音的视频推荐系统。32. Collaborative Filtering:协同过滤,基于用户行为进行推荐。比如:阿里的商品推荐系统。33. Content-Based Filtering:基于内容过滤,基于内容特征进行推荐。比如:快手的内容推荐算法。34. Hybrid Recommendation:混合推荐,结合多种推荐技术。比如:抖音的混合推荐系统。35. Personalization:个性化,根据用户偏好提供服务。比如:腾讯的个性化推荐平台。八、搜索与信息检索
36. IR (Information Retrieval):信息检索,从大量数据中提取信息。比如:百度的搜索引擎。37. Web Crawling:网络爬虫,从互联网中自动收集数据。比如:阿里的网页爬虫技术。38. Indexing:索引,通过建立索引加速数据检索。比如:腾讯的搜索引擎索引技术。39. Query Processing:查询处理,优化用户查询的结果。比如:小红书的搜索查询优化。40. Semantic Search:语义搜索,通过理解语义进行搜索。比如:智谱的智能搜索引擎。九、强化学习
41. RL (Reinforcement Learning):强化学习,通过奖励和惩罚优化行为。比如:阿里达摩院的游戏AI。42. Q-Learning:Q学习,一种无模型的强化学习算法。比如:DeepMind的AlphaGo。43. Policy Gradient:策略梯度,优化策略的强化学习方法。比如:OpenAI的强化学习模型。44. Monte Carlo Methods:蒙特卡罗方法,使用随机抽样进行决策。比如:DeepSeek的强化学习系统。45. Multi-Armed Bandit:多臂强盗问题,用于探索和利用的强化学习算法。比如:字节跳动的广告投放优化。十、图形处理
46. GAN (Generative Adversarial Networks):生成对抗网络,用于生成图像和视频。比如:Runway的AI艺术创作平台。
47. CG (Computer Graphics):计算机图形学,创建和处理图像。比如:Pixar的动画制作技术。
48. Rendering:渲染,将模型转换为图像。比如:阿里的云渲染服务。
49. Image Processing:图像处理,处理和分析图像。比如:字节跳动的图像增强技术。
50. 3D Modeling:三维建模,创建三维物体的数字表示。比如:蔚来汽车的虚拟现实展示。
十一、机器人技术
51. Robotics:机器人技术,设计和制造机器人。比如:波士顿动力的机器狗。
52. Automation:自动化,通过技术实现任务自动化。比如:阿里的仓库自动化系统。
53. Path Planning:路径规划,设计机器人的移动路径。比如:蔚来汽车的自动驾驶路径规划。
54. Sensor Fusion:传感器融合,结合多个传感器的数据。比如:滴滴的自动驾驶传感器融合技术。
55. SLAM (Simultaneous Localization and Mapping):同时定位与地图构建,构建环境地图并定位自身。比如:Google的自动驾驶项目Waymo。
十二、视频算法
56. Stable Diffusion:Stable Diffusion,稳定扩散,用于图像和视频生成的算法。比如:Stability AI 的稳定扩散技术。57. DiT:Diverse Interactive Training,多样化交互训练,用于增强视频生成的多样性。比如:DeepMind 的 DiT 模型。58. Video Super-Resolution:Video Super-Resolution,视频超分辨率,提高视频质量的技术。比如:Tencent 的视频超分辨率算法。59. Temporal Action Detection:Temporal Action Detection,时间动作检测,识别视频中的动作和活动。比如:Facebook 的时间动作检测模型。60. Video Object Segmentation:Video Object Segmentation,视频对象分割,分离视频中的不同对象。比如:Adobe 的视频对象分割工具。《AI黑话辞典》第一弹60个词就到这里啦!记得收藏+关注,马上继续更新!
后续也将分类别呈现,比如很火的【视频模型】等等,都可以单独列出来高频关键词,也更方便查找。
“我用的词汇越多,我能说出的东西就越多”(The more words I use, the more I can say)“哲学问题常常是因为词语在语言中的位置误导我们”(Philosophical problems arise when language goes on holiday)“理解一个词的意义,就是理解它的语言游戏”(To understand the meaning of a word is to understand its language game)
维特根斯坦对【AI未来】的16条启示
《AI黑话辞典》飞书表格版:
https://hz6qzzcb9k.feishu.cn/sheets/DUMms7OSfhRLmmt5Qrzcurz7nQb
新鲜真话,关注一下👆
期待给大家带来更多实践里制造、检验的信息,更渴望能说点别人不说的、说不了的。
朋友圈会发一些具体的案例和商业化日常~
AI交流,欢迎加我本人微信:FrankGPTs