当前位置: 首页 > news >正文

成都网站建设qghl小型网站开发费用

成都网站建设qghl,小型网站开发费用,优秀营销软文范例800字,wordpress前台发文积分目录 model_selection.train_test_split函数实战 model_selection.train_test_split函数 model_selection.train_test_split 是 Scikit-Learn 中用于将数据集拆分为训练集和测试集的函数。这个函数非常有用,因为在机器学习中,我们通常需要将数据集分为训…

目录

  • model_selection.train_test_split函数
  • 实战

model_selection.train_test_split函数

model_selection.train_test_split 是 Scikit-Learn 中用于将数据集拆分为训练集和测试集的函数。这个函数非常有用,因为在机器学习中,我们通常需要将数据集分为训练集和测试集,以便在模型训练和评估中使用不同的数据集。

下面是 model_selection.train_test_split 函数的基本介绍:

model_selection.train_test_split(*arrays, test_size=None, train_size=None, random_state=None, shuffle=True, stratify=None)
  1. *arrays: 这是待拆分的数据集,可以是特征矩阵和目标向量,也可以是多个特征矩阵。例如,如果有一个特征矩阵 X 和一个目标向量 y,可以使用 X, y 作为参数传入。
  2. test_size: 测试集的大小,可以是浮点数(表示比例)或整数(表示样本数)。
  3. train_size: 训练集的大小,和 test_size 作用相同,如果不指定则默认为 1 - test_size。
  4. random_state: 随机种子,用于控制数据集的随机拆分,以便结果可重复。 shuffle: 是否在拆分数据前对数据进行洗牌。
  5. stratify: 按照某个变量(通常是目标变量)进行分层抽样,以确保训练集和测试集中各类别样本的比例与原始数据集中相同。

举个例子,假设有一个特征矩阵 X 和一个目标向量 y,可以使用 model_selection.train_test_split 将数据集拆分为训练集和测试集:

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

这将会把特征矩阵 X 和目标向量 y 按照 8:2 的比例拆分为训练集和测试集,并且使用随机种子 42 来确保拆分结果的可重复性。

实战

# 导入模块
from sklearn import model_selection
import statsmodels.api as sm
import numpy as np 
import pandas as pd 
from scipy.stats import f # 导入数据
Profit = pd.read_excel(r'Predict to Profit.xlsx')
# 生成由State变量衍生的哑变量
dummies = pd.get_dummies(Profit.State)
# 将哑变量与原始数据集水平合并
Profit_New = pd.concat([Profit,dummies], axis = 1)
# 删除State变量和California变量(因为State变量已被分解为哑变量,New York变量需要作为参照组)
Profit_New.drop(labels = ['State','New York'], axis = 1, inplace = True)
# 拆分数据集Profit_New
train, test = model_selection.train_test_split(Profit_New, test_size = 0.2, random_state=1234)
# 建模
model2 = sm.formula.ols('Profit~RD_Spend+Administration+Marketing_Spend+Florida+California', data = train).fit()
print('模型的偏回归系数分别为:\n', model2.params)模型的偏回归系数分别为:Intercept             58068.048193
Florida[T.True]        1440.862734 
California[T.True]      513.468310 
RD_Spend                  0.803487 
Administration           -0.057792 
Marketing_Spend           0.013779 
dtype: float64
http://www.yayakq.cn/news/207550/

相关文章:

  • 网站建设用到的算法成都市城乡建设网站
  • 如何建立自己免费网站江门网站建设联系电话
  • 聊城正规网站建设设计公司公司网站怎么更新
  • 做网站怎么变现市场调研分析报告
  • 网站php怎么做的天猫网站建设的目标
  • 健康管理公司网站建设网站开发 jz.woonl
  • 文案写作网站怎么申请免费企业邮箱账号
  • 有哪些做电子商务的网站百度排行榜风云榜小说
  • 网站开发项目方案书网站seo关键词排名查询
  • 新浪网站制作怎么自己在电脑上做网站
  • 广告公司寮步网站建设价钱洛阳网络运营公司
  • 美业设计网站蚌埠seo外包
  • 网站及网页设计费用科技信息网站建设的背景
  • 企业网站栏目设置说明黄页号码标记申诉
  • wordpress网站速度慢网站设计创意方案
  • 免费货源在线网站手机怎么制作钓鱼网站
  • 电脑网页打不开建设银行网站做销售有什么软件可以找客户
  • 公司怎么建立网站吗中国企业黄页信息网
  • 网站报价方案建筑招工网站
  • 做网站颜色黑色代码多少钱设计展板排版样式
  • windows2008 建网站制作ppt的基本做法
  • 如何向百度提交站点收录信息百度的网站网址
  • 网站开发虚拟主机是什么模板建站优缺点
  • 渭南 网站集约化建设静态网站首页更新
  • 南京市网站学习网站建设的是什么专业
  • 江苏神禹建设有限公司网站网站搭建制作
  • 建设美妆企业网站公司网站做百度推广需要交费吗
  • 怎样建立自己的视频号网站优化怎么做论坛
  • 网站开发面向对象企业网站html5
  • 一个好网站应具备哪些条件wordpress名站