1. 机器学习2021:机器学习基本概念简介

发布于 2022年 01月 13日 17:19

腾讯服务器

88 / 年

  • 上海/北京/广州...
  • 2核 2G 4M
  • Linux/Windows
新年大优惠

腾讯服务器

425 / 年

  • 上海/北京/广州...
  • 4核 8G 10M
  • Linux/Windows
年度最便宜

腾讯服务器

1249 / 年

  • 上海/北京/广州...
  • 8核 16G 14M
  • Linux/Windows
点击查看

这是我参与更文挑战的第 1 天,活动详情查看: 更文挑战

本篇文章是李宏毅老师的机器学习课程笔记,课程传送门👇。
【機器學習2021】預測本頻道觀看人數 (上) - 機器學習基本概念簡介

让机器找一个函式

概括来说,机器学习就是让机器具备找一个函式的能力。那机器具备找函式的能力以后,他可以做什么样的事情呢?举例来说,以下几件事情都可以让机器去完成。

假设你今天想要叫机器做语音辨识,机器听一段声音,产生这段声音对应的文字,那你需要的就是一个函式,这个函式的输入是声音讯号,输出是这段声音讯号的内容。可以想像这个函式一定非常复杂,也显然不是能用手写出来的方程式,所以我们期待借助机器的力量,将这个函式自动找出来,这就是机器学习。

影像辨识

同样的,一个函式,输入的是图像,输出的是这个图像中有什么样的内容。

要让机器下围棋,我们可以用一个函式,输入的是棋牌上白子和黑子的位置,输出的是机器下一步应该落子的位置,如果够厉害,我们也可以做一个 AlphaGo。 随着我们要找的函式不同,机器学习有不同的类别。

机器学习方向

Regression 回归

假如我们要找的函式,它的输出是一个数值即一个标量,那找出这个函式的人物就叫做 Regression。

举例来讲,我们找出的函式的输入可能是种种跟预测 PM2.5 有关的指数,包括今天的 PM2.5 的数值、今天的平均温度、今天平均的臭氧浓度等等,它的输出是明天中午的 PM2.5 的数值,那这就是 Regression 任务。

Classification 分类

这个任务要机器做的是选择题,我们人类先准备好一些选项,这些选项又叫作类别(classes),我们现在要找的函式它的输出就是从我们设定好的选项里面选择一个当作输出,那这个问题这个任务就叫作 Classification。 ​

举例来说,Gmail 账户里面有一个函式,这个函式可以帮我们侦测一封邮件是不是垃圾邮件。它的输入是一封电子邮件,它的输出可能的选项就是两个,是垃圾邮件或不是垃圾邮件。那机器要从是或否里面选一个选项出来,这个问题叫作 Classification,当然,Classification 不一定只有两个选项,也可以有多个选项。 ​

举例来说 alphago 本身也是一个 Classification 的问题,只是这个 Classification 的选项是比较多的。我们想想看,棋盘上有 19 乘 19 个位置,那其实问题就转化成一个有 19 乘 19 个选项的选择题。我们要机器做的就是找一个函式,这个函式的输入是棋盘上黑子跟白子的位置,输出就是从 19 乘 19 个选项里面选出一个正确的选项,这个问题也是一个分类的问题。

Structured Learning 结构化学习

也就是机器今天不只是要做选择题,不只是输出一个数字,还要产生一个有结构的物件。举例来说,机器画一张图、写一篇文章,这种叫机器产生有结构的东西的问题就叫作 Structured Learning。如果用拟人化的讲法说,就是要叫机器学会创造这件事情。

推荐文章