AI for everyone 什么是 AI(一)
1.什么是 AI
一、机器学习
监督学习 = 学习从输入 A 到输出 B 的映射。例如:邮件 → 是否垃圾邮件;图片 → 是否有猫;音频 → 文字。
监督学习近年成功的关键:大量数据 + 大型神经网络(靠 GPU 等硬件支持)。
数据:通常像 Excel 表格,需要输入 A 和输出 B。
获取数据有三种方式:
- 手动标注(人工打标签)
- 观察行为(用户点击、机器故障记录等)
- 下载或合作(公开数据集,注意版权)
两个常见误区:
- 不要先花几年建 IT 系统收集数据,再做 AI → 应让 AI 团队早期介入,告诉你要收集什么。
- 不要以为有了大数据就自动产生价值 → 需要 AI 团队分析。
结构化数据(表格)和非结构化数据(图像、音频、文本)都重要,AI 都能处理。
二、AI 术语
- 机器学习:构建自动运行的软件(输入 → 输出)。
- 数据科学:从数据中提取洞察,输出报告或 PPT(比如“三居室比两居室贵 15%”)。
- 深度学习 ≈ 神经网络:当前机器学习的核心工具,擅长学习复杂的 A→B。
- 人工智能(AI) :更大的工具集,机器学习是其中最大的子集。
三、神经网络与深度学习
神经网络:由许多“人工神经元”组成,可以学习从 A 到 B 的任意复杂映射。
关键优势:你不需要告诉它中间步骤,只要给大量 A 和 B,它会自动学习中间特征。
例子:人脸识别
- 计算机看到的是像素数字(比如 1000×1000 的彩色图 = 300 万个数字)。
- 神经网络自动学习:早期神经元检测边缘 → 中期检测眼睛、鼻子 → 后期检测人脸整体 → 输出身份。
你只需提供大量人脸图片 + 对应人名,网络自己学会一切。
四、AI 能做什么,不能做什么
一个实用的经验法则:
任何你一秒钟内能思考完成的任务,监督学习很可能做到。
能做(例子) :
- 检测车辆位置(自动驾驶)
- 看照片判断有没有划痕
- 听音频转文字
- 分类客户邮件(退款/物流/其他)
- 从 X 光片诊断肺炎
很难或不能(例子) :
- 理解行人手势意图(手势太多样,数据难收集,安全要求极高)
- 只用 10 张医学图片和几段文字学会诊断(AI 需要大量数据,无法像人类那样从少量例子学习)
- 生成有同理心的客户回复(当前技术很难)
- 分析市场并写 50 页报告(需要长时间思考)
AI 的弱点:
- 从少量数据学习复杂概念能力差
- 对新类型数据(与训练数据不同)泛化能力弱,比如在一家医院训练好的肺炎诊断模型,换到另一家医院可能因为 X 光角度、划痕等而性能下降
即使是专家,也常常需要几周的技术调研才能判断一个项目是否可行。
五、如何让公司真正成为 AI 公司
教训来自互联网时代:
- 有个网站 ≠ 互联网公司。真正的互联网公司会做广泛 A/B 测试、下放决策权。
- 同样,用了几个算法 ≠ AI 公司。
优秀 AI 公司的四个特征:
- 战略数据获取:故意推出不赚钱的免费产品,只为收集有价值数据。
- 统一数据仓库:避免数据孤岛,让工程师能关联所有数据。
- 擅长发现自动化机会:能识别哪些任务可以用监督学习替代人工。
- 设立新角色:如机器学习工程师,团队协作方式不同。
AI 转型五步法:
- 执行试点项目:先做几个小项目,体验 AI 的能与不能。
- 组建内部 AI 团队,提供广泛培训:不仅培训工程师,还要培训管理者、高管。
- 制定 AI 战略:根据对 AI 的理解,制定公司战略。
- 统一内外部沟通:让员工、客户、投资者等保持一致认知。
最终目标:帮助公司(无论软件还是非软件行业)提升 AI 能力,创造巨大价值。
一句话总结
AI 公司 ≠ 用了几个算法,而是要战略获取数据、统一数据仓库、擅长发现自动化、设立新角色。监督学习擅长一秒内能完成的任务 + 大量数据;不擅长少量学习、复杂共情、跨场景泛化。神经网络自动学习从像素到人脸,你只需要给数据。转型五步:试点 → 建队培训 → 定战略 → 内外沟通。