好湿?好紧?好多水好爽自慰,久久久噜久噜久久综合,成人做爰A片免费看黄冈,机机对机机30分钟无遮挡

主頁 > 知識庫 > 分享python機器學習中應用所產生的聚類數據集方法

分享python機器學習中應用所產生的聚類數據集方法

熱門標簽:ai電話機器人哪里好 湛江智能外呼系統廠家 宿遷星美防封電銷卡 西藏房產智能外呼系統要多少錢 百度地圖標注沒有了 外呼并發線路 地圖標注審核表 長沙高頻外呼系統原理是什么 ai電銷機器人源碼

01直接生成

這類方法是利用基本程序軟件包numpy的隨機數產生方法來生成各類用于聚類算法數據集合,也是自行制作輪子的生成方法。

一、基礎類型

1、月牙形數據集合

from headm import *
import numpy as np
pltgif = PlotGIF()
def moon2Data(datanum):
    x1 = linspace(-3, 3, datanum)
    noise = np.random.randn(datanum) * 0.15
    y1 = -square(x1) / 3 + 4.5 + nois
    x2 = linspace(0, 6, datanum)
    noise = np.random.randn(datanum) * 0.15
    y2 = square(x2 - 3) / 3 + 0.5 + noise
    plt.clf()
    plt.axis([-3.5, 6.5, -.5, 5.5])
    plt.scatter(x1, y1, s=10)
    plt.scatter(x2, y2, s=10)
    plt.draw()
    plt.pause(.1)
    pltgif.append(plt)
for _ in range(20):
    moon2Data(300)
pltgif.save(r'd:\temp\GIF1.GIF')


2、方形數據集

from headm import *
import numpy as np
pltgif = PlotGIF()
def moon2Data(datanum):
    x = np.random.rand(datanum, 2)
    condition1 = x[:, 1] = x[:, 0]
    condition2 = x[:, 1] = (1-x[:, 0])
    index1 = np.where(condition1  condition2)
    x1 = x[index1]
    x = np.delete(x, index1, axis=0)
    index2 = np.where(x[:, 0] = 0.5)
    x2 = x[index2]
    x3 = np.delete(x, index2, axis=0)
    plt.clf()
    plt.scatter(x1[:, 0], x1[:, 1], s=10)
    plt.scatter(x2[:, 0], x2[:, 1], s=10)
    plt.scatter(x3[:, 0], x3[:, 1], s=10)
    plt.draw()
    plt.pause(.1)
    pltgif.append(plt)
for _ in range(20):
    moon2Data(1000)
pltgif.save(r'd:\temp\GIF1.GIF')


3、螺旋形數據集合

from headm import *
import numpy as np
pltgif = PlotGIF()
def randData(datanum):
    t = 1.5 * pi * (1+3*random.rand(1, datanum))
    x = t * cos(t)
    y = t * sin(t)
    X = concatenate((x,y))
    X += 0.7 * random.randn(2, datanum)
    X = X.T
    norm = plt.Normalize(y.min(), y.max())
    plt.clf()
    plt.scatter(X[:, 0], X[:, 1], s=10, c=norm(X[:,0]), cmap='viridis')
    plt.axis([-20, 21, -20, 16])
    plt.draw()
    plt.pause(.1)
    pltgif.append(plt)
for _ in range(20):
    randData(1000)
pltgif.save(r'd:\temp\GIF1.GIF')


下面的知識螺旋線,沒有隨機移動的點。

將隨機幅值從原來的0.7增大到1.5,對應的數據集合為:


02樣本生成器

利用sklearn.datasets自帶的樣本生成器來生成相應的數據集合。

一、基礎數據集

1、點簇形數據集合

from headm import *
from sklearn.datasets import make_blobs
pltgif = PlotGIF()
def randData(datanum):
    x1,y1 = make_blobs(n_samples=datanum, n_features=2, centers=3, random_state=random.randint(0, 1000))
    plt.clf()
    plt.scatter(x1[:,0], x1[:, 1], c=y1, s=10)
    plt.draw()
    plt.pause(.1)
    pltgif.append(plt)
for _ in range(20):
    randData(300)
pltgif.save(r'd:\temp\gif1.gif')

繪制三簇點集合,也可以使用如下的語句:

plt.scatter(x1[y1==0][:,0], x1[y1==0][:,1], s=10)
plt.scatter(x1[y1==1][:,0], x1[y1==1][:,1], s=10)
plt.scatter(x1[y1==2][:,0], x1[y1==2][:,1], s=10)

2、線簇形數據集合

生成代碼,只要在前面的x1后面使用旋轉矩陣。

transformation = [[0.60834549, -0.63667341], [-0.40887718, 0.85253229]]
x1 = dot(x1, transformation)

其中轉換矩陣的特征值與特征向量為:

  • 特征值:[0.20581711.25506068]
  • 特征向量:[[-0.845237740.7015526][-0.53439045-0.71261768]]

3、環形數據集合

from headm import *
from sklearn.datasets import make_circles
pltgif = PlotGIF()
def randData(datanum):
    x1,y1 = make_circles(n_samples=datanum, noise=0.07, random_state=random.randint(0, 1000), factor=0.6)
    plt.clf()
    plt.scatter(x1[y1==0][:,0], x1[y1==0][:,1], s=10)
    plt.scatter(x1[y1==1][:,0], x1[y1==1][:,1], s=10)
    plt.axis([-1.2, 1.2, -1.2, 1.2])
    plt.draw()
    plt.pause(.1)
    pltgif.append(plt)
for _ in range(20):
    randData(1000)
pltgif.save(r'd:\temp\gif1.gif')

4、月牙數據集合

from headm import *
from sklearn.datasets import make_moons
pltgif = PlotGIF()
def randData(datanum):
    x1,y1 = make_moons(n_samples=datanum, noise=0.07, random_state=random.randint(0, 1000))
    plt.clf()
    plt.scatter(x1[y1==0][:,0], x1[y1==0][:,1], s=10)
    plt.scatter(x1[y1==1][:,0], x1[y1==1][:,1], s=10)
    plt.axis([-1.5, 2.5, -1, 1.5])
    plt.draw()
    plt.pause(.1)
    pltgif.append(plt)
for _ in range(20):
    randData(1000)
pltgif.save(r'd:\temp\gif1.gif')

測試結論

sklearn里面還有好多函數來自定制數據,除此之外還可以使用numpy生成,然后通過高級索引進行劃分,最好結合著matplotlib中的cmap來做顏色映射,這樣可以做出好玩又好看的數據集,希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python機器學習之K-Means聚類實現詳解
  • python機器學習實戰之K均值聚類
  • 機器學習10大經典算法詳解
  • 如何用 Python 處理不平衡數據集

標簽:大同 林芝 寧夏 普洱 南平 漯河 盤錦 海南

巨人網絡通訊聲明:本文標題《分享python機器學習中應用所產生的聚類數據集方法》,本文關鍵詞  分享,python,機器,學習,中,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《分享python機器學習中應用所產生的聚類數據集方法》相關的同類信息!
  • 本頁收集關于分享python機器學習中應用所產生的聚類數據集方法的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 一本色道久久综合亚洲精品久久| 女人和男人操| 伊在人亚洲香蕉精品区麻豆| 杨贵妃疯狂做爰| 阿娇被实干20分钟未删视频| 理论电影中文字幕| 是不是想要了我这就给你| 日本japanesexxxxx乱| 国产一级a毛一级a看免费软件下载| 国产伦一区二区三区四区久久| 花蝴蝶在线直播免费观看韩国| 99精品国产免费久久A片性麻豆| 日本xxx高清| 我好硬弄不出来涨着难受| 少妇做爰喷水久久久ff文字描述| 班长被?到爽??流小说| mm131美女大尺度私密| jizz69女士第一次| 草草女人院| 欧美另类z0zx在线观看| 潘金莲和武松做爰H| 国产成人精品AV| 97国产熟妇视频二区| 囯产一级特黄毛AA片| 国产精品久久久久久精品毛片桃花| 国产v综合v亚洲欧第1集 | 男女做爰猛烈吃奶吃出乳液| 欧美黑人狂躁亚洲AV| 4d肉蒲团之性战奶水| 成 人 黄 色 免费 观 看下载| 我是看守专用宠物2| 在线观看高清免费播放| 欧美性受xxxx视频| 丁香九月婷婷| 好涨太深太大了受不了| 国产污片在线观看| 操老逼| 无码人妻精品一区二区三区99日韩 | 蜜臀91丨九色丨蝌蚪| you在线观看免费完整版| 偷窥沟厕女厕白嫩大屁股|