×

scala

大数据分析(随机森林)(随机森林数据集)

写真素材中心 写真素材中心 发表于2024-06-21 浏览5521 评论0
什么是随机森林 随机森林是多个决策树集成算法,树多了也就成了森林,随机森林包含多个决策树来降低过拟合, 那随机2字又该怎么解释呢?? 随机体现在: 每次迭代时,对原始数据进行二次抽样来获得不同的训练数据。 对于每个树节点,考虑不同的随机特征子集来进行分裂。 spark代码实现 spark.ml支持二分类、多分类以及回归的随机森林算法 数据采用https://archive.ics.uci.edu/ml/machine-learning-databases/iri