python 生成随机聚类数据

这篇具有很好参考价值的文章主要介绍了python 生成随机聚类数据。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

def get_clusters(n,m):
    sigma = 1
    mean = [3,6,9,12]
    num = [2*n,n,int(1.2*n),int(0.8*n)]
    data = []
    label = []
    tmpdata = []
    for i in range(num[0]):
        tmpdata = []
        for j in range(m):
            tmpdata.append(random.gauss(mean[0], sigma))
        # tmpdata.append(0)
        label.append(0)
        data.append(tmpdata)
    for i in range(num[1]):
        tmpdata = []
        for j in range(m):
            tmpdata.append(random.gauss(mean[1], sigma))
        # tmpdata.append(1)
        data.append(tmpdata)
        label.append(1)
    for i in range(num[2]):
        tmpdata = []
        for j in range(m):
            tmpdata.append(random.gauss(mean[2], sigma))
        # tmpdata.append(2)
        label.append(2)
        data.append(tmpdata)
    for i in range(num[3]):
        tmpdata = []
        for j in range(m):
            tmpdata.append(random.gauss(mean[3], sigma))
        # tmpdata.append(3)
        label.append(3)
        data.append(tmpdata)    
    return data,label

数据是满足高斯分布的随机数
生成一个m维属性,样本数量=2n+n+1.2n+0.8n=5n的数据集。
每一个for循环代表一个类,共生成四个类(0,1,2,3四类)。
返回生成的数据集和对应的标签。
sigma控制方差,表示一个类的松散程度;mean是一个类的平均值,控制数据取值以及类类之间的距离。文章来源地址https://www.toymoban.com/news/detail-648396.html

到了这里,关于python 生成随机聚类数据的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • python聚类算法、模式识别

    1.聚类算法的实现 编程实现K-均值算法,并用K-均值算法解决聚类问题 解释算法的实现过程,并对结果进行分析 2.在你的生活和工作中有什么问题是可以用模式识别问题的思路来描述,并解决的?请同学们模仿人脸识别问题解决过程,思考工作中的什么问题可以转换为模式识

    2024年02月07日
    浏览(24)
  • 随机生成密码(Python)

    随机密码生成是一种常见的加密技术,可以帮助用户在创建账户时生成强大的密码,从而保护账户的安全性。 随机生成密码。编写程序,在26个字母大小写和9个数字组成的列表中随机生成10个8位密码。 方法一: 运行结果: 方法二: 具体步骤: 1、导入random模块,用于生成随

    2024年02月03日
    浏览(39)
  • Python 随机生成双色球

    先说说双色球的组成规则: 1. 双色球投注区分为红色球号码区和蓝色球号码区 2. 红色球号码区由1-33共三十三个号码组成,红色球共 6 个,6 个红球不能重复 3. 蓝色球号码区由1-16共十六个号码组成,蓝球 1 个 4. 双色球打票的显示效果为:08 15 21 22 29 32 01 1. 先随机生成 6 个红

    2023年04月22日
    浏览(32)
  • Python 生成随机图片验证码

    在写一个Web项目的时候一般要写登录操作,而为了安全起见,现在的登录功能都会加上输入图片验证码这一功能,在利用Django开发Web项目的过程中,可以使用 Python 生成一个如下所示的图片验证码: pillow详细内容参考官方文档:https://pillow.readthedocs.io/en/stable/?badge=latest pillow的

    2024年02月15日
    浏览(39)
  • Python随机生成1到100随机数的常用方法!

    编写程序时,我们经常需要用到随机数,而且随机数在很多场景下都很有用,比如游戏、密码生成等等,那么Python如何随机生成1到100的随机数?以下是常用方法介绍。 1、使用random模块 Python中的random模块提供了生成随机数的函数。其中,randint()函数可以生成指定范围内的随机

    2024年04月15日
    浏览(39)
  • Python——Kmeans聚类算法、轮廓系数(算法理论、代码)

    目录 1 Kmeans模型理论 1.1 K-均值算法(K-means)算法概述 1.2 距离度量 1.3 K-means算法流程 1.4 K值的选择 1.5 K-means的优点 1.6 K-means的缺点 1.7 聚类的评价指标 2 代码解释 3 实操  3.1 构建聚类数目为3的KMeans模型 3.2 占比饼图 3.3 轮廓系数值 3.4 使用for循环计算聚类个数为2至9时的轮廓

    2024年02月01日
    浏览(41)
  • python:random --- 生成伪随机数

    该模块实现了各种分布的伪随机数生成器。 对于整数,从范围中有统一的选择。 对于序列,存在随机元素的统一选择、用于生成列表的随机排列的函数、以及用于随机抽样而无需替换的函数。 在实数轴上,有计算均匀、正态(高斯)、对数正态、负指数、伽马和贝塔分布的

    2024年02月09日
    浏览(40)
  • 人工智能算法|K均值聚类算法Python实现

    K 均值聚类算法是一种简单的迭代型聚类算法,采用距离作为相似性指标,从而发现给定数据集中的 K 个类,且每个类有一个聚类中心,即质心,每个类的质心是根据类中所有值的均值得到。对于给定的一个包含n个d维数据点的数据集X以及要分得的类别 K ,选取欧式距离作为

    2024年02月05日
    浏览(45)
  • 【机器学习】DBSCAN聚类算法(含Python实现)

    DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一种基于密度的聚类算法,可以将数据点分成不同的簇,并且能够识别噪声点(不属于任何簇的点)。 DBSCAN聚类算法的基本思想是: 在给定的数据集中,根据每个数据点周围其他数据点的密度情况,将数据点分为核心点

    2023年04月23日
    浏览(34)
  • 如何用Python生成4位数的随机数字

    如上所述,我们可以使用Python库做各种事情,如创建虚拟环境、单元测试、创建数独解算器等。我们可以用Python做的另一个简单活动是生成随机数。 有时在编码时,我们可能需要不同位数的随机数。我们可以把它用于密码、设备的安全引脚等。 使用random 模块在Python中生成随

    2024年02月08日
    浏览(32)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包