AI 全景概述
人工智能(Artificial Intelligence,AI)是计算机科学的一个重要分支,致力于构建能够模拟、延伸乃至超越人类智能的系统与方法。自 1956 年正式作为学科诞生以来,AI 经历了多次起落,如今已渗透到工业、医疗、金融、教育、娱乐等几乎所有领域,成为新一轮技术革命的核心驱动力。
AI 的定义
AI 的定义随时代演进而不断扩展。早期定义强调"让机器执行需要人类智能才能完成的任务",涵盖推理、规划、理解自然语言、识别图像、学习等能力。现代更宽泛的理解将 AI 视为一类能够感知环境、处理信息并做出决策的计算系统。
从工程角度看,AI 系统的核心特征包括:
- 感知:从环境中获取信号(图像、文本、语音、传感器数据)
- 推理:基于已有知识或数据进行逻辑或统计推断
- 学习:从经验中更新模型参数或知识表示
- 行动:输出决策、生成内容或控制执行器
AI 的三大技术支柱与主要分支
机器学习(Machine Learning,ML)
机器学习是 AI 的核心方法论,其核心思想是"从数据中自动学习规律",而非手工编写规则。ML 算法分为监督学习、无监督学习和强化学习三大范式,广泛应用于分类、回归、聚类、推荐系统等场景。
深度学习(Deep Learning,DL)
深度学习是机器学习的一个子集,以多层人工神经网络为基础,能够自动从原始数据中提取层次化特征。深度学习在图像识别(ImageNet 竞赛)、语音识别(端到端语音模型)、自然语言处理(BERT、GPT)等领域取得了突破性成果,是当前 AI 研究的主流范式。
自然语言处理(NLP)
NLP 专注于让计算机理解和生成人类语言。技术演进路径从词袋模型、TF-IDF 到 Word2Vec 词向量,再到 BERT 预训练模型和 GPT 系列大语言模型(LLM),实现了从简单文本分类到多轮对话、代码生成、跨语言翻译的质变。
计算机视觉(CV)
CV 使机器能够"看懂"图像和视频,核心任务包括图像分类、目标检测、语义分割、人脸识别、姿态估计等。CNN 架构的成熟和近年来 Vision Transformer(ViT)的崛起,使 CV 系统在多项任务上超越人类水平。
强化学习(Reinforcement Learning,RL)
RL 通过智能体与环境的交互学习最优策略,以奖惩信号为驱动。DeepMind 的 AlphaGo、AlphaZero 和 OpenAI Five 展示了 RL 在复杂博弈中的强大能力;RLHF(基于人类反馈的强化学习)成为对齐大语言模型的关键技术。
AI、ML、DL 的包含关系
这三个概念是层层嵌套的包含关系,而非并列概念:
人工智能(AI)
└── 机器学习(ML)
└── 深度学习(DL)
├── CNN(卷积神经网络)
├── RNN/LSTM(循环神经网络)
└── Transformer(注意力机制)
- AI 是最广泛的概念,包含所有使机器表现出智能行为的方法,包括规则系统、搜索算法、ML 等
- ML 是 AI 的一个主要实现路径,强调从数据中学习
- DL 是 ML 的子集,以深度神经网络为工具,擅长处理非结构化数据(图像、文本、音频)
AI 对现代工业的深远影响
制造业
AI 驱动的计算机视觉系统实现了产品质检自动化,缺陷检测准确率超过人工检验员;数字孪生结合 AI 预测维护,显著降低设备停机成本;机器人路径规划和协作机器人(Cobot)重塑了生产线。
医疗健康
医学影像 AI(CT、MRI、病理切片分析)在部分疾病的早期诊断中达到专家级水平;AlphaFold 2 解决了蛋白质结构预测这一长达 50 年的难题,极大加速了药物研发;AI 辅助的个性化治疗方案正逐步走向临床。
金融科技
实时欺诈检测、智能投顾、信用评分模型、高频交易算法均依托 AI 技术;自然语言处理用于财报分析、舆情监控和合规文件审查,大幅提升处理效率。
交通与自动驾驶
自动驾驶系统融合了 CV(目标检测)、传感器融合(LiDAR/Camera/Radar)、RL(决策规划)等多项 AI 技术,Waymo、Tesla、百度 Apollo 等企业已在特定场景落地商业运营。
内容创作与创意产业
生成式 AI(DALL-E、Stable Diffusion、Sora、GPT-4o)将图像、视频、音乐、文本的生成成本降至接近零,深刻改变了内容创作、游戏开发、广告设计等行业的工作流程。
本知识库结构导读
本知识库按照从基础到进阶的学习路径组织内容,适合有一定编程基础的读者系统学习 AI 技术:
- overview/:AI 全景认知,包括历史脉络、主要范式、AGI 讨论
- fundamentals/math/:线性代数、概率统计、微积分三大数学基础
- fundamentals/ml/:监督学习、无监督学习、强化学习核心算法
- fundamentals/deep-learning/:神经网络、CNN、RNN、Transformer 架构详解
- llm/:大语言模型原理、预训练、微调、对齐与部署
- applications/:典型应用场景与工程实践案例
建议初学者按顺序阅读,有经验的读者可按需跳转到感兴趣的模块。