AI for everyone 什么是 AI(一)

1.什么是 AI

一、机器学习

  • 监督学习 = 学习从输入 A 到输出 B 的映射。例如:邮件 → 是否垃圾邮件;图片 → 是否有猫;音频 → 文字。

  • 监督学习近年成功的关键:大量数据 + 大型神经网络(靠 GPU 等硬件支持)。

  • 数据:通常像 Excel 表格,需要输入 A 和输出 B。

  • 获取数据有三种方式:

    1. 手动标注(人工打标签)
    2. 观察行为(用户点击、机器故障记录等)
    3. 下载或合作(公开数据集,注意版权)
  • 两个常见误区

    • 不要先花几年建 IT 系统收集数据,再做 AI → 应让 AI 团队早期介入,告诉你要收集什么。
    • 不要以为有了大数据就自动产生价值 → 需要 AI 团队分析。
  • 结构化数据(表格)和非结构化数据(图像、音频、文本)都重要,AI 都能处理。

二、AI 术语

  • 机器学习:构建自动运行的软件(输入 → 输出)。
  • 数据科学:从数据中提取洞察,输出报告或 PPT(比如“三居室比两居室贵 15%”)。
  • 深度学习 ≈ 神经网络:当前机器学习的核心工具,擅长学习复杂的 A→B。
  • 人工智能(AI) :更大的工具集,机器学习是其中最大的子集。

三、神经网络与深度学习

  • 神经网络:由许多“人工神经元”组成,可以学习从 A 到 B 的任意复杂映射

  • 关键优势:你不需要告诉它中间步骤,只要给大量 A 和 B,它会自动学习中间特征。

  • 例子:人脸识别

    • 计算机看到的是像素数字(比如 1000×1000 的彩色图 = 300 万个数字)。
    • 神经网络自动学习:早期神经元检测边缘 → 中期检测眼睛、鼻子 → 后期检测人脸整体 → 输出身份。
  • 你只需提供大量人脸图片 + 对应人名,网络自己学会一切。

四、AI 能做什么,不能做什么

一个实用的经验法则

任何你一秒钟内能思考完成的任务,监督学习很可能做到。

能做(例子)

  • 检测车辆位置(自动驾驶)
  • 看照片判断有没有划痕
  • 听音频转文字
  • 分类客户邮件(退款/物流/其他)
  • 从 X 光片诊断肺炎

很难或不能(例子)

  • 理解行人手势意图(手势太多样,数据难收集,安全要求极高)
  • 只用 10 张医学图片和几段文字学会诊断(AI 需要大量数据,无法像人类那样从少量例子学习)
  • 生成有同理心的客户回复(当前技术很难)
  • 分析市场并写 50 页报告(需要长时间思考)

AI 的弱点

  • 少量数据学习复杂概念能力差
  • 新类型数据(与训练数据不同)泛化能力弱,比如在一家医院训练好的肺炎诊断模型,换到另一家医院可能因为 X 光角度、划痕等而性能下降

即使是专家,也常常需要几周的技术调研才能判断一个项目是否可行。

五、如何让公司真正成为 AI 公司

教训来自互联网时代

  • 有个网站 ≠ 互联网公司。真正的互联网公司会做广泛 A/B 测试、下放决策权。
  • 同样,用了几个算法 ≠ AI 公司

优秀 AI 公司的四个特征

  1. 战略数据获取:故意推出不赚钱的免费产品,只为收集有价值数据。
  2. 统一数据仓库:避免数据孤岛,让工程师能关联所有数据。
  3. 擅长发现自动化机会:能识别哪些任务可以用监督学习替代人工。
  4. 设立新角色:如机器学习工程师,团队协作方式不同。

AI 转型五步法

  1. 执行试点项目:先做几个小项目,体验 AI 的能与不能。
  2. 组建内部 AI 团队,提供广泛培训:不仅培训工程师,还要培训管理者、高管。
  3. 制定 AI 战略:根据对 AI 的理解,制定公司战略。
  4. 统一内外部沟通:让员工、客户、投资者等保持一致认知。

最终目标:帮助公司(无论软件还是非软件行业)提升 AI 能力,创造巨大价值。

一句话总结

AI 公司 ≠ 用了几个算法,而是要战略获取数据、统一数据仓库、擅长发现自动化、设立新角色。监督学习擅长一秒内能完成的任务 + 大量数据;不擅长少量学习、复杂共情、跨场景泛化。神经网络自动学习从像素到人脸,你只需要给数据。转型五步:试点 → 建队培训 → 定战略 → 内外沟通。