当前位置: 首页 > news >正文

宣武郑州阳网站建设网站内容设计

宣武郑州阳网站建设,网站内容设计,做游戏的软件app,抚州网站建设公司介绍用于机器学习的 Fashion-MNIST 数据集 为什么要研究数据集? 让我们首先思考一下为什么要花时间研究数据集的问题。数据是深度学习的主要成分,虽然作为神经网络程序员的任务是让我们的神经网络从我们的数据中学习,但我们仍然有责任了解我…

介绍用于机器学习的 Fashion-MNIST 数据集

为什么要研究数据集?

让我们首先思考一下为什么要花时间研究数据集的问题。数据是深度学习的主要成分,虽然作为神经网络程序员的任务是让我们的神经网络从我们的数据中学习,但我们仍然有责任了解我们实际用于训练的数据的性质和历史。

一般来说,计算机程序由两个主要组成部分:代码和数据。在传统编程中,程序员的工作是直接编写软件或代码,但在深度学习和神经网络中,所谓的软件就是网络本身,特别是网络在训练过程中自动出现的权重。

​​在这里插入图片描述

程序员的工作是监督和指导训练过程中的学习。我们可以将其视为一种间接编写软件或代码的方式。通过使用数据和深度学习,神经网络程序员可以生产出能够执行计算的软件,而无需编写明确执行这些计算的代码。

因此,数据在开发软件中的作用正在转变,我们可能会看到软件开发人员的角色也随之转变。

关注数据的考虑因素:

  • 谁创建了数据集?
  • 数据集是如何创建的?
  • 使用了哪些转换?
  • 数据集的意图是什么?
  • 可能的意外后果?
  • 数据集是否有偏见?
  • 数据集是否存在伦理问题?

在实践中,获取和访问数据通常是深度学习中最困难的部分之一,因此在我们了解这个特定数据集时,请记住我们在这里看到的一般概念和想法。

MNIST 数据集是什么?

MNIST 数据集,修改后的国家标准与技术研究院数据库,是一个著名的手写数字数据集,通常用于训练机器学习的图像处理系统。NIST 代表 国家标准与技术研究院

MNIST 中的 M 代表 修改过的,这是因为有一个原始的 NIST 数字数据集被修改成了 MNIST。

在这里插入图片描述

MNIST 因为使用频率高而闻名。它通常出于两个原因而被使用:

  1. 初学者使用它,因为它简单
  2. 研究人员使用它来基准测试(比较)不同的模型

数据集包含 70,000​ 张手写数字图像,具体分为:

  • 60,000​ 张训练图像
  • 10,000​ 张测试图像

这些图像最初是由美国人口普查局员工和美国高中生创建的。

MNIST 被如此广泛地使用,图像识别技术也得到了如此大的改进,以至于数据集被认为太简单了。这就是为什么创建了 Fashion-MNIST 数据集。

Fashion-MNIST 是什么?

Fashion-MNIST,顾名思义,是一个时尚物品的数据集。具体来说,数据集有以下十类时尚物品:

索引标签
0T 恤/上衣
1裤子
2套头衫
3连衣裙
4外套
5凉鞋
6衬衫
7运动鞋
8
9短靴

正如我们在之前的帖子中看到的,这些物品的样本看起来像这样:

在这里插入图片描述

Fashion-MNIST 的起源是什么?

Fashion-MNIST 图像来自哪里?Fashion-MNIST 基于 Zalando 网站上的商品组合。Zalando 是一家总部位于德国的跨国时尚商务公司,成立于 2008 年。

这就是为什么我们在 GitHub URL 中看到 zalandoresearch,Fashion-MNIST 数据集可供下载。

Zalando Research 是公司内部创建数据集的团队。

当我们回顾介绍数据集的论文时,我们会看到更多关于图像收集方式的内容,但首先,让我们回答另一个潜伏的问题。

Fashion 数据集中的 MNIST 是什么意思?

为什么 Fashion-MNIST 中有 MNIST?

Fashion MNIST 数据集之所以在名称中有 MNIST,是因为创建者希望用 Fashion-MNIST 替代 MNIST。

因此,Fashion 数据集被设计成尽可能地模仿原始 MNIST 数据集,同时由于数据比手写图像更复杂,引入了更高的训练难度。

我们将看到 Fashion-MNIST 如何在论文中模仿原始数据集,但我们已经看到的一件事是类别的数量。

  • MNIST - 有 10 个类别(每个数字 0-9 一个)
  • Fashion-MNIST - 有 10 个类别(这是故意的)

让我们来看看这篇论文。

在 arXiv 上阅读 Fashion-MNIST 论文

关于论文的第一件事是,作者来自 Zalando Research(Fashion-MNIST 的起源)。

在阅读了论文的摘要后,我们看到了数据集被命名为 Fashion-MNIST 的原因。

Fashion-MNIST 论文的摘要

我们介绍了 Fashion-MNIST,这是一个新的数据集,包含 70,000 张 28 x 28 灰度图像,涵盖 10 个类别的时尚产品,每个类别 7,000 张图像。训练集有 60,000 张图像,测试集有 10,000 张图像。Fashion-MNIST 旨在作为原始 MNIST 数据集的直接替代品,用于基准测试机器学习算法,因为它具有相同的图像大小、数据格式以及训练和测试拆分的结构。数据集可在 https://github.com/zalandoresearch/fashion-mnist 免费获取。

  • arXiv 论文

数据集被设计成原始 MNIST 的替代品。通过使 Fashion-MNIST 数据集规范与原始 MNIST 规范相匹配,从旧数据集到新数据集的转换可以顺利进行。论文声称,切换数据集所需的唯一更改是从获取 MNIST 数据集的 URL 改为指向 Fashion 数据集。

论文还为我们提供了更多关于 MNIST 如此受欢迎的原因的见解:

“MNIST 如此受欢迎的原因与其大小有关,这使得深度学习研究人员能够快速检查和原型化他们的算法。这也得到了补充,因为所有机器学习库(例如 scikit-learn)和深度学习框架(例如 Tensorflow、PyTorch)都提供了使用 MNIST 的辅助函数和方便的示例。”

  • arXiv 论文

PyTorch 为我们提供了一个名为 torchvision​ 的包,使我们能够轻松地开始使用 MNIST 以及 Fashion-MNIST。

我们将在下一篇文章中使用 torchvision​ 将我们的训练集加载到我们的项目中。

Fashion-MNIST 是如何构建的

与 MNIST 数据集不同,时尚集不是手绘的,但数据集中的图像是 Zalando 网站上的实际图像。

然而,它们已经被转换以更接近 MNIST 规范。这是每个网站图像经历的一般转换过程:

  1. 转换为 PNG
  2. 裁剪
  3. 调整大小
  4. 锐化
  5. 扩展
  6. 反色
  7. 灰度化

要查看此过程的更详细描述,请务必查看论文的第二部分。

使用 torchvision​ 访问 Fashion-MNIST

总之,我们已经看到了 Fashion-MNIST 数据集的起源和历史,尽管该数据集被设计成更具挑战性的计算机视觉问题,但该集合仍然是一个很好的起点。

我们将通过一个名为 torchvision​ 的 PyTorch 视觉库访问 Fashion-MNIST,并构建我们的第一个神经网络,该网络能够准确预测给定输入时尚图像的输出类别。

http://www.yayakq.cn/news/63987/

相关文章:

  • 做玩具订制网站好处泰安网络建设
  • 淘宝网pc首页宁波seo关键词如何优化
  • 遵义网站建设价格文化馆门户网站建设的作用及意义
  • 有了域名 接下来怎么做网站阿里云wordpress搭建网站
  • 怎么做网站推广和宣传淘宝客如何做返积分制网站
  • 国外自适应网站模版专业广州网站设计
  • 如何自己做网站挣钱如何在手机上开发软件
  • 网站欣赏网站建网站 需要签署协议
  • 网站建设初期的需求分析成都解封公告
  • 网站备案 法人怎样查看网站是否备案
  • 如何做网站快照网站做优化一开始怎么做
  • aspit网站源码带手机版成都app程序开发
  • 企业网站建设中重庆网站建设模板服务
  • 民勤县建设局网站全国建筑一体化平台管理系统
  • 长沙网站开发在线咨询建站运营新闻
  • 网站建设工作不足及整改天河区建网站
  • 做网站怎么报价摄影网站模板源码
  • 网站版心怎么做手机网站策划书方案
  • 网站优化垂直化好还是扁平化好免费域名申请国外
  • 大连做企业网站哪家好保定的网站建设
  • 帝国cms建站实例教程互联网推广营销推荐隐迅推
  • 哪些网站有二维码开发者大会
  • 珠海企业网站建设费用如何做小程序平台
  • 网页后端开发wordpress手机版优化
  • 用vs做网站教程百度推广怎么做的
  • wordpress 首页文章摘要优化设计四年级下册语文答案
  • 菏泽网站开发公司手机网络营销策划书
  • 重庆企业网站推广价格音乐网页设计材料加字加图片
  • 商务网站可以做哪些可以做动漫网站的源码源码
  • 静态网站怎么维护wordpress找不到jquery