【IT168 编译】对于机器学习而言,并不存在“一体适用”的说法。构建不同的模型需要用到不同的算法和不同技术,但如何才能确定哪种技术最合适呢?
数据是否被贴上标签,决定了它是被监督还是无人监督的。监督学习使用人类标记过的数据,通常在数据有能力预测可能发生的事件时使用。换句话说,在我们知道自己需要得到什么样的结果输出时,所输入数据就是这些标记过的数据。该算法对一组输入数据进行处理,并得到相应的输出结果,通过将该输出结果与正确结果进行比较来发现错误。一旦发现错误,就可以相应地对模型进行修改。
分类属于监督学习,可以定义为尝试预测给定输入的输出结果。分类采用一组未知的实体,将其识别为更大的已知组。为了进行学习,它需要一组已标记的实例,例如图像、文本或语音。随着训练次数的增长,使分类器达到高准确度所需的数据量可能很大,达到数千甚至数百万个实例。虽然分类通常针对简单的类别,但它可以扩展到目标是一个结构或一个序列的情况,就像自然语言处理一样。
无监督学习使用无标记的数据。在这种情况下,机器在不了解任何事先数据或信息的情况下发现了新的模式。当数据被归类到类似的数据组时,这种类型的学习会在集群下很好地工作。
受强化行为心理观念的,强化学习是一种学习的。机器可以通过多次尝试和错误来获得一个理想的结果。随着时间的推移,它学会了选择某种行为,以得到理想的结果。这种类型的学习经常被应用于游戏、等应用程序中。
深度神经网络(DNNs),又称人工神经网络(ANN),代表了一套用于构建强大的学习系统的技术。与某些算法不同,它们添加了一些“隐藏”层,用于提取中间表示。这种技术于20世纪80年代被发明,在2010年之后开始腾飞,华晨宇父亲华福雄这种飞速增长得益于强大的并行硬件和易于使用的开源软件。