AI 全景概述

人工智能（Artificial Intelligence，AI）是计算机科学的一个重要分支，致力于构建能够模拟、延伸乃至超越人类智能的系统与方法。自 1956 年正式作为学科诞生以来，AI 经历了多次起落，如今已渗透到工业、医疗、金融、教育、娱乐等几乎所有领域，成为新一轮技术革命的核心驱动力。

AI 的定义

AI 的定义随时代演进而不断扩展。早期定义强调"让机器执行需要人类智能才能完成的任务"，涵盖推理、规划、理解自然语言、识别图像、学习等能力。现代更宽泛的理解将 AI 视为一类能够感知环境、处理信息并做出决策的计算系统。

从工程角度看，AI 系统的核心特征包括：

感知：从环境中获取信号（图像、文本、语音、传感器数据）
推理：基于已有知识或数据进行逻辑或统计推断
学习：从经验中更新模型参数或知识表示
行动：输出决策、生成内容或控制执行器

AI 的三大技术支柱与主要分支

机器学习（Machine Learning，ML）

机器学习是 AI 的核心方法论，其核心思想是"从数据中自动学习规律"，而非手工编写规则。ML 算法分为监督学习、无监督学习和强化学习三大范式，广泛应用于分类、回归、聚类、推荐系统等场景。

深度学习（Deep Learning，DL）

深度学习是机器学习的一个子集，以多层人工神经网络为基础，能够自动从原始数据中提取层次化特征。深度学习在图像识别（ImageNet 竞赛）、语音识别（端到端语音模型）、自然语言处理（BERT、GPT）等领域取得了突破性成果，是当前 AI 研究的主流范式。

自然语言处理（NLP）

NLP 专注于让计算机理解和生成人类语言。技术演进路径从词袋模型、TF-IDF 到 Word2Vec 词向量，再到 BERT 预训练模型和 GPT 系列大语言模型（LLM），实现了从简单文本分类到多轮对话、代码生成、跨语言翻译的质变。

计算机视觉（CV）

CV 使机器能够"看懂"图像和视频，核心任务包括图像分类、目标检测、语义分割、人脸识别、姿态估计等。CNN 架构的成熟和近年来 Vision Transformer（ViT）的崛起，使 CV 系统在多项任务上超越人类水平。

强化学习（Reinforcement Learning，RL）

RL 通过智能体与环境的交互学习最优策略，以奖惩信号为驱动。DeepMind 的 AlphaGo、AlphaZero 和 OpenAI Five 展示了 RL 在复杂博弈中的强大能力；RLHF（基于人类反馈的强化学习）成为对齐大语言模型的关键技术。

AI、ML、DL 的包含关系

这三个概念是层层嵌套的包含关系，而非并列概念：

人工智能（AI）
  └── 机器学习（ML）
        └── 深度学习（DL）
              ├── CNN（卷积神经网络）
              ├── RNN/LSTM（循环神经网络）
              └── Transformer（注意力机制）

AI 是最广泛的概念，包含所有使机器表现出智能行为的方法，包括规则系统、搜索算法、ML 等
ML 是 AI 的一个主要实现路径，强调从数据中学习
DL 是 ML 的子集，以深度神经网络为工具，擅长处理非结构化数据（图像、文本、音频）

AI 对现代工业的深远影响

制造业

AI 驱动的计算机视觉系统实现了产品质检自动化，缺陷检测准确率超过人工检验员；数字孪生结合 AI 预测维护，显著降低设备停机成本；机器人路径规划和协作机器人（Cobot）重塑了生产线。

医疗健康

医学影像 AI（CT、MRI、病理切片分析）在部分疾病的早期诊断中达到专家级水平；AlphaFold 2 解决了蛋白质结构预测这一长达 50 年的难题，极大加速了药物研发；AI 辅助的个性化治疗方案正逐步走向临床。

金融科技

实时欺诈检测、智能投顾、信用评分模型、高频交易算法均依托 AI 技术；自然语言处理用于财报分析、舆情监控和合规文件审查，大幅提升处理效率。

交通与自动驾驶

自动驾驶系统融合了 CV（目标检测）、传感器融合（LiDAR/Camera/Radar）、RL（决策规划）等多项 AI 技术，Waymo、Tesla、百度 Apollo 等企业已在特定场景落地商业运营。

内容创作与创意产业

生成式 AI（DALL-E、Stable Diffusion、Sora、GPT-4o）将图像、视频、音乐、文本的生成成本降至接近零，深刻改变了内容创作、游戏开发、广告设计等行业的工作流程。

本知识库结构导读

本知识库按照从基础到进阶的学习路径组织内容，适合有一定编程基础的读者系统学习 AI 技术：

overview/：AI 全景认知，包括历史脉络、主要范式、AGI 讨论
fundamentals/math/：线性代数、概率统计、微积分三大数学基础
fundamentals/ml/：监督学习、无监督学习、强化学习核心算法
fundamentals/deep-learning/：神经网络、CNN、RNN、Transformer 架构详解
llm/：大语言模型原理、预训练、微调、对齐与部署
applications/：典型应用场景与工程实践案例

建议初学者按顺序阅读，有经验的读者可按需跳转到感兴趣的模块。

AI 的定义​

AI 的三大技术支柱与主要分支​

机器学习（Machine Learning，ML）​

深度学习（Deep Learning，DL）​

自然语言处理（NLP）​

计算机视觉（CV）​

强化学习（Reinforcement Learning，RL）​

AI、ML、DL 的包含关系​

AI 对现代工业的深远影响​

制造业​

医疗健康​

金融科技​

交通与自动驾驶​

内容创作与创意产业​

本知识库结构导读​