揭开机器学习的神秘面纱,其实这件事你我都做了12年
-
在遇到问题时,我们希望应用方法得到一个最接近于正确解的答案。
但是方法并不能凭空产生,需要从以往的问题及其正解中学习得到二者的关系。
-
应用就是用方法在新问题中得到答案
-
学习就是在已有问题及其正解中得到方法
-
获得方法才是学习的目的
比如我们在大量历年高考题及其正解中学习解决某类问题的方法,高中学习的目的是希望得到一个可以解决高考中任意该类问题的方法。
但是在高考之前,我们并不知道自己的方法是否有效,所以就有了模拟考试。应用模拟题和方法得出答案,通过和模拟题正解的对比,得出考试分数,从而衡量方法的有效性。
决定一切的是最后的高考题,然而高考也只是验证自己学习到的方法的有效性的一次模拟,不同之处在于,该次模拟的结果是供他人参考的,各个大学和企业会用该次模拟的结果来判断你所学方法的有效性,来判断你将来解决问题的能力,更多的是判断你的学习能力。
上述过程是高考学习,同时也是机器学习中最重要的监督学习,是指有明确答案,可供寻找问题与答案之间关系的学习方式。
不过以上概念在机器学习里有新的名字,描述问题与正解之间关系的方法叫做模型,学习已有问题与正解之间关系的过程叫做训练,解决新问题的过程叫做预测,衡量模型好坏的过程叫做评估,训练所用的问题及正解叫做训练集,评估所用问题及正解叫做测试集。训练集和测试集都是数据,需要提前搜集。
而当前人工智能的核心,也就是将你我从小学到高中做了12年的事情搬到计算机上来做,最终目的是希望得到一个可以解决该任务下任意新问题的模型。也就是用数据来训练出模型并且再应用。
-