这个瓜集合是我们的 训练集 ,根据所学内容的复杂性,它需要有很多 瓜 (或网页或其他)。 随着时间的推移,计算机将开始构建一个模型,说明它认为西瓜的各种属性如何影响它是否成熟。机器学习可以处理这些交互可能相对复杂的情况(例如,成熟的西瓜的硬度可能会根据西瓜的颜色和环境温度而改变)集中的每个甜瓜(想象这是你;现在你已经注意到你之前没有注意到的东西,你可以回到以前的甜瓜并从中学到更多。
旦我们确信计算机掌握了它
的窍门那么我们就可以通过向它展示它尚未见过的另一个集合 澳大利亚电话号码表 中的西瓜来对其进行测试(我们将这组西瓜称为 验证集 ),但是我们不分享这些瓜是否成熟。现在,并预测西瓜是否成熟(甚至可能成熟或不成熟)。我们可以从有多少瓜中看出计算机准确地识别出它学得有多好。如果它学得不好,我们可能需要给它看更多的瓜,或者我们可能需要在幕后调整算法( 大脑 )并重新开始。 这种方法称为监督学习。
我们为学习算法提供有关
原始西瓜是否成熟的详细信息。确实存在替代方法,但监督习是最好的起点,并且可能涵盖了谷歌正在做的一些事情。 这里要注意的一件事是,即使你训练了计算机可以很好地识别成熟的西瓜,它也不能比农民更能写出我们希望从农民那里得到的详尽规则集 电子邮件列表 咖啡因基础设施更新 那么这一切如何适应搜索呢? 首先,我们需要回到 年,推出 基础设施更新。当时我们还不知道,咖啡因是熊猫和企鹅的鼻祖。正是咖啡因让熊猫和企鹅诞生了。