当前位置:茂名新闻网 > 新闻 > 国内新闻 >

手把手 | Apache MXNet助力数字营销,检测社交网络照片中的商标品牌

2018-04-06 08:01 网络整理 点 击:次 移动版

标签:

      

大数据文摘授权转载自OReillyData 织梦好,好织梦


dedecms.com

数字营销是指在数字平台上推广服务和产品。广告技术(通常简写为“ad tech”)是指供应商、品牌及其代理机构使用数字技术来定位潜在客户,提供个性化信息和产品,并分析线上花费带来的效果。 织梦好,好织梦


织梦好,好织梦

例如,赞助的故事在Facebook新闻传播里的传播;在Instagram里的故事量;在YouTube的视频内容开始前播放的广告;由Outbrain支持的美国有线电视新闻网文章末尾的建议链接,所有这些都是实际使用广告技术的案例。 本文来自织梦


dedecms.com

在过去的一年里,深度学习在数字营销和广告技术中得到了显著地应用。 本文来自织梦


本文来自织梦

在这篇文章中,我们将深入探讨一个流行的应用场景的一部分:挖掘网络名人认可的商品。在此过程中,我们将能了解深度学习架构的相对价值,进行实验,理解数据量大小的影响,以及在缺乏足够数据时如何增强数据等内容。

内容来自dedecms


织梦内容管理系统

应用场景概述

copyright dedecms


织梦内容管理系统

在本文中,我们将看到如何建立一个深度学习分类器,该分类器可以根据带有商标的图片来预测该商品所对应的公司。本节概述了可以使用此模型的场景。

内容来自dedecms


织梦好,好织梦

名人会认可一些产品。通常,他们会在社交媒体上发布图片来炫耀他们认可的品牌。典型帖子会包含一张图片,其中有名人自己和他们写的一些文字。相对应的,品牌的拥有者也渴望了解这些帖子的里他们品牌的展现,并向可能受到影响的潜在客户展示它们。 织梦好,好织梦


copyright dedecms

因此,这一广告技术应用的工作流程如下:将大量的帖子输入处理程序以找出名人、品牌和文字内容。然后,对于每个潜在客户,机器学习模型会根据时间、地点、消息、品牌以及客户的偏好品牌和其他内容生成非常独特的广告。另外一个模型则进行目标客户群的检测。随后进行目标广告的发送。 内容来自dedecms


织梦内容管理系统

下图显示了这一工作流程: 内容来自dedecms


copyright dedecms

织梦好,好织梦

名人品牌认可机器人的工作流程。图片由Tuhin Sharma提供

dedecms.com


dedecms.com

如你所见,该系统由多个机器学习模型组成。 织梦好,好织梦


本文来自织梦

考虑一下上面所说的图像。这些照片可以是在任何情况下拍摄的。因此首要目标就是确定照片中的物体和名人。这可以通过物体检测模型完成。然后,下一步是识别品牌(如果有的话)。而识别品牌最简单的方法就是通过识别它的商标。

织梦好,好织梦


copyright dedecms

在本文中,我们将研究如何构建一个深度学习模型来通过图像中的商标识别品牌。后续的文章将讨论构建机器人的其他部分(物体检测、文本生成等)。 织梦好,好织梦


织梦内容管理系统

问题定义

内容来自dedecms


内容来自dedecms

本文中要解决的问题是:给定一张图片,通过标识图片里的商标来预测图片对应的公司(品牌)。 本文来自织梦


织梦好,好织梦

数据 copyright dedecms


本文来自织梦

要构建机器学习模型,获取高质量数据集是必须的。在现实业务中,数据科学家会与品牌经理和代理商合作来获得所有可能的商标。 织梦内容管理系统

为了本文的目的,我们将利用FlickrLogo数据集。该数据集有来自Flickr(一个流行的照片分享网站)的真实图片。FlickrLogo页面上有关于如何下载数据的说明。如果你想使用本文中的代码构建自己的模型,请自行下载数据。

copyright dedecms


dedecms.com

模型

织梦好,好织梦


本文来自织梦

从商标标识别品牌是一个经典的计算机视觉问题。在过去的几年中,深度学习已成为解决计算机视觉问题的最新技术。因此我们将为我们的场景构建深度学习模型。 内容来自dedecms


织梦好,好织梦

软件

本文来自织梦


本文来自织梦

在之前的文章中,我们谈到了Apache MXNet的优点。我们还谈到了Gluon这一基于MXNet的更简单的接口。两者都非常强大,并允许深度学习工程师快速尝试各种模型架构。 织梦内容管理系统

现在让我们来看看代码。 dedecms.com


织梦好,好织梦

我们首先导入构建模型所需的库: dedecms.com


dedecms.com

import mxnet as mx

import cv2

from pathlib import Path

import os

from time import time

import shutil

本文来自织梦


import matplotlib.pyplot as plt

%matplotlib inline

copyright dedecms

copyright dedecms


织梦内容管理系统

我们使用FlickrLogos数据集里的FlickrLogos-32数据集。变量是这个数据集的URL。

copyright dedecms


内容来自dedecms

%%capture

!wget -nc # Replace with the URL to the dataset

!unzip -n ./FlickrLogos-32_dataset_v2.zip

织梦好,好织梦

copyright dedecms


内容来自dedecms

数据准备

织梦内容管理系统


copyright dedecms

接着是创建下述的数据集: copyright dedecms

  1. Train (训练数据集)

    内容来自dedecms

  2. Validation (验证数据集) dedecms.com

  3. Test (测试数据集)

    copyright dedecms


dedecms.com

FlickrLogos数据已经分好了训练、验证和测试数据集。下面是数据里图片的信息。 织梦好,好织梦


内容来自dedecms

  • 训练数据集包括32个类别,每个类别有10张图片。

    织梦内容管理系统

  • 验证数据集里有3960张图片,其中3000张没有包含商标。

    内容来自dedecms

  • 测试数据有3960张图片。 copyright dedecms


copyright dedecms

所有的训练数据图片都包含有商标,但有些验证和测试数据里的图片没有包含商标。我们是希望构建一个有比较好泛化能力的模型。即我们的模型可以准确地预测它没有见过的图片(验证和测试的图片)。

织梦好,好织梦


织梦内容管理系统

为了让我们的训练更快速、准确,我们将把50%的没有商标的图片从验证数据集移到训练数据集。这样我们制作出大小为1820的训练数据集(在从验证数据集添加1500个无商标图像之后),并将验证数据集减少到2460张(在移出1500个无商标图像之后)。在现实生活中,我们应该尝试使用不同的模型架构来选择一个在实际验证和测试数据集上表现良好的模型架构。

内容来自dedecms


本文来自织梦

下一步,我们定义存储数据的目录。 copyright dedecms

转载请注明出处: /view-160707-1.html

相关新闻

     相关文章>>
发表评论
评价:
表情:
验证码:点击我更换图片
谢谢观看!
茂名新闻网每天新鲜每天精彩