当前位置: 首页 > news >正文

阿里云建站可不可以备案移动端公众号网站开发

阿里云建站可不可以备案,移动端公众号网站开发,上海十大外贸公司,app开发要多少钱Facebook_location_KNN 流程分析: 1.数据集获取(大型数据怎么获取? 放在电脑哪里? 算力怎么搞?) 2.基本数据处理(数据选取-确定特征值和目标值-分割数据集) 缩小数据范围 选择时间特征 去掉签到较少的地方 确定特征值和目标值 分割数据集 3.特征工程(特征预处理:标…

Facebook_location_KNN

流程分析:

1.数据集获取(大型数据怎么获取? 放在电脑哪里? 算力怎么搞?)

2.基本数据处理(数据选取-确定特征值和目标值-分割数据集)

缩小数据范围

选择时间特征

去掉签到较少的地方

确定特征值和目标值

分割数据集

3.特征工程(特征预处理:标准化)

4.模型训练(KNN+CV)

5.模型评估

代码实现基本步骤

1.数据导入

1.1导入facebook_location_train_set(数据集大小:1.8G), 需要加载一段时间

import pandas as pd
locdata=pd.read_csv(r"C:\Users\鹰\Desktop\ML_Set\FaceBook_train.csv\FaceBook_train.csv")

1.2对数据的信息的简单分析

显示部分数据

locdata.head()

查看数据描述

locdata.describe()

查看数据行列数

locdata.shape

2.数据基本处理

2.1缺失值处理

print(“查看数据缺失值:”)
print(locdata.isna().sum())
locdata.dropna()
print(locdata.isna().sum())

2.2数据提取

缩小数据范围

locdata= locdata.query(“x>2.0 & x<2.5 & y>2.0 & y<2.5”)

选择时间特征, 对time进行转化

time=pd.to_datetime(locdata[“time”], unit=“s”)
time=pd.DatetimeIndex(time)
locdata[“day”]=time.day
locdata[“hour”]=time.hour
locdata[“weekday”]=time.weekday

去掉签到较少的地方, 在这里去掉签到次数小于三的地点

place_set= locdata.groupby(“place_id”).count()
place_set= place_set[place_set[“row_id”]>3]
locdata=locdata[locdata[“place_id”].isin(place_set.index)]

确定目标值和特征值, 用loc和iloc可以吗? 有什么区别吗?

x_all=locdata[[“x”,“y”,“accuracy”,“day”,“hour”,“weekday”]]
y_all=locdata[“place_id”]####

2.3数据集分割

from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test=train_test_split(x_all, y_all,test_size=0.2)###
print(x_train)
print(x_test)
print(y_train)
print(y_test)

3.特征工程

3.1特征预处理-标准化

from sklearn.preprocessing import StandardScaler
scaler=StandardScaler()
x_train=scaler.fit_transform(x_train)
x_test=scaler.fit_transform(x_test)

4.模型训练-KNN+CV

4.1KNN调用

from sklearn.neighbors import KNeighborsClassifier
estimator=KNeighborsClassifier()

4.2模型优化

from sklearn.model_selection import GridSearchCV
params={“n_neighbors”:[1,3,5,7,9]}
estimator=GridSearchCV(estimator, param_grid=params, cv=5)

4.3模型训练

estimator.fit(x_train, y_train)

5.模型评估

5.1预测值

y_predict=estimator.predict(x_test)
print(“预测值为:”, y_predict)

5.2准确率

score=estimator.score(x_test,y_test)
print(“准确率为:”, score)

5.2最优模型参数:

print(“最优模型为:”, estimator.best_estimator_)

5.3最好评分

print(“最高分:”, estimator.best_score_)

数据集Facebook_Location下载地址:

链接:https://pan.baidu.com/s/1uoeo6pukkjSuLlKW9RwnCQ
提取码:7hlo

http://www.yayakq.cn/news/875898/

相关文章:

  • 微信内部劵网站怎么做人力资源公司如何做推广
  • 宁波外贸seo网站建设地推网站信息怎么做
  • 网站首页幻灯片代码万盛网站建设
  • 河南省建设厅陈华平官方网站山西网站建设
  • 招聘网站的简历可以做几份做网站的基本步骤
  • 广州制作网站公司哪家好可视化网站建设软件
  • 广州seo网站排名腾讯qq
  • go语言可以做网站吗什么网站可以做电影投资
  • 北京网站建设首选小峰官方网站建设投标书
  • 怎么让网站让百度收录做个淘宝客网站怎么做
  • 电商网站建设与运营成本pc 移动端网站建设
  • 网站付款接口这么做网页网站开发
  • 附近做网站的公司电话广州seo运营
  • 如何给网站添加外链电子商务网站建设作用
  • wordpress企业网站模板破解艺术字体在线生成器下载
  • 做网站用语言视频网站如何赚钱
  • 瑶海区网站建设公司网站备案密码有什么用
  • 松江大学城网站建设wordpress 离线发布
  • 快速建站用什么seo优化排名怎么做
  • 地方旅游网站模板顶易云外贸软件
  • 百元便宜建站互联网公司是什么
  • 网站移动端开发公司wordpress后台使用
  • 家里的电脑怎样做网站赚钱wordpress 评论顶踩
  • category wordpress厦门seo收费
  • 网站换友链平台营销型网站建设一般多少钱
  • 佛山网站优化推广方案网页编辑器安卓
  • 人人做免费网站简单的电商网站
  • 广州站图片宁陵网站建设
  • 网站模板 带后台成品短视频app下载有哪些软件好
  • 金华公司建站模板WordPress文章怎么折叠