sklearn中make_blobs()
方法参数:
-
n_samples
:表示数据样本点个数,默认值100 -
n_features
:是每个样本的特征(或属性)数,也表示数据的维度,默认值是2。默认为 2 维数据,测试选取 2 维数据也方便进行可视化展示。 -
centers
:表示类别数(标签的种类数),默认值3 -
cluster_std
表示每个类别的方差,例如我们希望生成2类数据,其中一类比- 另一类具有更大的方差,可以将cluster_std设置为[1.0,3.0],浮点数或者浮点数序列,默认值1.0 -
center_box
:中心确定之后的数据边界,默认值(-10.0, 10.0) -
shuffle
:将数据进行洗乱,默认值是True文章来源:https://www.toymoban.com/news/detail-699443.html -
random_state
:官网解释是随机生成器的种子,可以固定生成的数据,给定数之后,每次生成的数据集就是固定的。文章来源地址https://www.toymoban.com/news/detail-699443.html
X, y = make_blobs(n_samples=100,
n_features=2,
centers=4,
cluster_std=1.0,
center_box=(-10.0, 10.0),
shuffle=True,
random_state=47)
plt.figure(figsize=(4, 3))
plt.scatter(X[:,0],X[:,1],c=y)
到了这里,关于sklearn中make_blobs方法:聚类数据生成器的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!