在机器学习PAI现在默认输出的是TOP50特征数量，怎么能让它输出更多特征数量的权重呢？[阿里云机器学习PAI]

在机器学习PAI现在默认输出的是TOP50特征数量，怎么能让它输出更多特征数量的权重呢？

「点点赞赏，手留余香」

还没有人赞赏，快来当第一个赞赏的人吧！

=====这是一个广告位，招租中，联系qq 78315851====

3 条回复 A 作者 M 管理员

wljslmzAM 2023-11-28 2:51:49 1

在阿里云机器学习PAI中，默认输出的确是 Top50 特征的权重，但我们可以通过设置参数来改变输出的特征数量。一般来说，这个参数被称为 numFeature。你可以尝试在代码中指定 setNumFeature(n) 来设置输出特征数量，其中 n 为你想要输出的特征数量。例如，如果你希望输出前100个特征的权重，则可以指定 setNumFeature(100)。这样就可以改变默认输出的 Top50 特征数量了。

具体来说，如果你使用的是 PAI 的 Python SDK，可以在 LinearRegression.train 方法的参数中添加 num_feature=n 来设置输出特征数量。如果你使用的是 PAI 的 Java SDK，可以在 LinearRegressionTrainBatchOp 组件上调用 setNumFeature(n) 来设置输出特征数量。不同的 SDK 使用不同的方法进行设置，但都支持这个参数。

已喜欢已反对
算精通AM 2023-11-28 2:51:49 2
在机器学习PAI中，您可以通过设置LGBMRegressor或LGBMClassifier的参数来控制输出的特征数量。具体来说，您可以使用feature_importances_属性来获取每个特征的重要性得分，并使用sort_values()方法按照重要性得分进行排序，然后选择前n个特征进行输出。

下面是一个示例代码，它将输出LGBMRegressor模型的前100个特征：

import lightgbm as lgb# 训练模型model = lgb.LGBMRegressor()model.fit(X_train, y_train)# 获取特征重要性得分并排序feature_importances = pd.Series(model.feature_importances_, index=X.columns)feature_importances = feature_importances.sort_values(ascending=False)# 输出前100个特征print(feature_importances.head(100))

在上面的示例代码中，X_train和y_train分别是训练数据的特征和标签，X是训练数据的特征。首先，我们使用LGBMRegressor训练了一个模型。然后，我们使用feature_importances_属性获取每个特征的重要性得分，并使用sort_values()方法按照重要性得分进行排序。最后，我们输出前100个特征的重要性得分。

您可以根据需要调整代码中的参数来输出更多或更少的特征。请注意，输出的特征数量应该根据您的数据集大小和模型复杂度进行调整，以避免过度拟合或欠拟合的问题。
已喜欢已反对
圆不溜秋的小猫猫AM 2023-11-28 2:51:49 3

那需要用op了。此回答整理自钉群“Alink开源–用户群”

已喜欢已反对

一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

在机器学习PAI现在默认输出的是TOP50特征数量，怎么能让它输出更多特征数量的权重呢？[阿里云机器学习PAI] 暂停朗读为您朗读

在机器学习PAI现在默认输出的是TOP50特征数量，怎么能让它输出更多特征数量的权重呢？[阿里云机器学习PAI]