原标题:腾讯开源业内最大多标签图像数据集,附ResNet-101模型

原标题:小蓦早资讯:李飞飞离职谷歌,工作重心将重新转回学术界

机器之心发布

mgm娱乐登录地址 1

允中 发自 凹非寺

mgm娱乐登录地址 2

不久之前,

编译 | 阿司匹林

出品 | AI科技大本营(公众号ID:rgznai100)

鹅厂福利,又是开源。

#新闻#

CVPR 2019 接收论文公布

近日,FAIR 团队的吴育昕和何恺明提出了组归一化(Group Normalization,简称
GN)的方法。其中,GN
将信号通道分成一个个组别,并在每个组别内计算归一化的均值和方差,以进行归一化处理。此外,GN
的计算与批量大小无关,而且在批次大小大幅变化时,精度依然稳定。实验结果证明,GN
在多个任务中的表现均优于基于 BN 的同类算法,这表明 GN
能够在一系列任务中有效地替代 BN。

最迟本月月底,腾讯AI Lab将开源“Tencent ML-Images”项目。

李飞飞离职谷歌,工作重心将重新转回学术界

:在超过 5100 篇投稿中,共有 1300 篇被接收,接收率达
25.2%。本文介绍了京东AI研究院被接受的一篇 Oral
论文,作者从优化的角度出发,通过实验解释了梯度稳定手段之一的 BatchNorm
是如何帮助随机初始化训练一阶段检测器 SSD,进而结合了 ResNet 与 VGGNet
来加强对小物体的检测。值得一提的是,本文第一作者朱睿还是一位大四学生,就读于中山大学数据科学与计算机学院,现于京东
AI 研究院视觉与多媒体实验室实习。

以下内容来自 Group Normalization 论文,AI科技大本营翻译:

不仅要开源多标签图像数据集ML-Images,以及业内目前同类深度学习模型中精度最高的深度残差网络ResNet-101。

谷歌云官方博客发布文章称,目前担任谷歌云AI/ML首席科学家的李飞飞将重返斯坦福大学,转为担任谷歌云AI/ML顾问,卡耐基梅隆大学计算机学院院长Andrew
Moore将负责谷歌云AI业务。李飞飞2016年11月加入谷歌,在担任谷歌云 AI/ML
首席科学家的同时,李飞飞还担任斯坦福大学副教授、斯坦福 AI
实验室负责人。

使用 ImageNet
预训练的网络模型能够帮助目标任务(物体检测、语义分割、细粒度识别等)快速收敛,然而使用预训练模型会带来诸多限制,其中一个问题就是改动特征提取网络的结构成本相对较高,需要耗时巨大的重新预训练来适应不同需求的任务。那么,如果不使用预训练模型,进行随机初始化训练,达到较高准确率的某些必要条件是什么?

mgm娱乐登录地址 3

mgm娱乐登录地址 4

彭博社曝光苹果发布会信息 推8款产品

机器之心发布

批归一化(Batch Normalization,简称 BN
)是深度学习发展中的一项里程碑技术,它让各种网络都能够进行训练。然而,沿着批次维度的归一化也带来了新问题:当统计不准确导致批次的大小越来越小时,BN
的错误会急剧增加。在训练更大的网络,以及执行将特征迁移至包括探测、分割、视频在内的计算机视觉任务时,BN
的使用就受到了限制,因为它们受限于内存消耗而只能使用小批次。

业内最大规模

mgm娱乐登录地址 5

不久之前,

在该论文中,我们提出了一种简单的组归一化的方法。GN
将信号通道分成一个个组别,并在每个组别内计算归一化的均值和方差,以进行归一化处理。GN
的计算与批量大小无关,而且在批次大小大幅变化时,精度依然稳定。例如在
ImageNet 上训练的 ResNet-50 ,当批次大小为 2 时,GN 的误差比 BN 低 10.6
%;当使用典型的批次大小时,GN 与 BN
的表现相当,并且优于其他归一化变体。此外,GN
可以自然地从预训练迁移到微调阶段。在 COCO 的目标检测和 Kinetics
的视频分类任务中,GN 的表现均优于基于 BN 的同类算法,这表明 GN
能够在一系列任务中有效地替代
BN。重要的是,只需几行代码,就可以在现代库中实现 GN。

值得注意的是,这次开源的ML-Images包含了1800万图像和1.1万多种常见物体类别,在业内已公开的多标签图像数据集中,规模最大,一般科研机构及中小企业的使用场景,应该够了。

9月10日消息,日前,彭博社曝光了苹果将在发布会推出的所有产品。其中包括三款新手机:5.8英寸的iPhone
X升级版,或命名为“iPhone Xs”;6.5英寸的iPhone X放大版,或命名为“iPhone
Xs Max”;6.1英寸的iPhone X低价版,或命名为“iPhone
Xr”。据报道,苹果还将推出具备更大显示屏的新款苹果手表、一款14英寸视网膜屏幕的低价位笔记本电脑,两款采用窄边框和高屏占比设计的iPad
Pro,此外,还将对盒式电脑Mac Mini进行升级。

mgm娱乐登录地址,CVPR 2019 接收论文公布

mgm娱乐登录地址 6

此前,业内公开的最大规模的多标签图像数据集是谷歌公司的Open Images,
包含900万训练图像和6000多物体类别。

腾讯AI Lab开源多标签图像数据集项目

:在超过 5100 篇投稿中,共有 1300 篇被接收,接收率达
25.2%。本文介绍了京东AI研究院被接受的一篇 Oral
论文,作者从优化的角度出发,通过实验解释了梯度稳定手段之一的 BatchNorm
是如何帮助随机初始化训练一阶段检测器 SSD,进而结合了 ResNet 与 VGGNet
来加强对小物体的检测。值得一提的是,本文第一作者朱睿还是一位大四学生,就读于中山大学数据科学与计算机学院,现于京东
AI 研究院视觉与多媒体实验室实习。

图1:ImageNet 分类误差与批次大小的关系。这是在 ImageNet 训练集中使用
8 块 GPU 训练的 ResNet-50 模型,并在验证集上进行了评估。

所以一旦腾讯ML-Images开源,毫无疑问将成为业内规模最大。

9月10日,腾讯AI
Lab宣布将于9月底开源“Tencent
ML-Images”项目,该项目由包括1800万训练图像和1.1万多常见物体类别的多标签图像数据集ML-Images,以及业内目前同类深度学习模型中精度最高的深度残差网络ResNet-101构成。除了数据集,腾讯AI
Lab团队还将在此次开源项目中详细介绍:大规模的多标签图像数据集的构建方法、基于ML-Images的深度神经网络的训练方法、基于ML-Images训练得到的ResNet-101模型。

使用 ImageNet
预训练的网络模型能够帮助目标任务(物体检测、语义分割、细粒度识别等)快速收敛,然而使用预训练模型会带来诸多限制,其中一个问题就是改动特征提取网络的结构成本相对较高,需要耗时巨大的重新预训练来适应不同需求的任务。那么,如果不使用预训练模型,进行随机初始化训练,达到较高准确率的某些必要条件是什么?

▌组归一化

不过腾讯方面认为,不光是数量规模上够诚意,在项目细节上,也都颇为用心:

#出行#

本文介绍了我们今年的 CVPR Oral 工作《ScratchDet: Exploring to Train
Single-Shot Object Detectors from
Scratch》,作者从优化的角度出发,通过实验解释了梯度稳定手段之一的
BatchNorm 是如何帮助随机初始化训练一阶段检测器 SSD,进而结合了 ResNet 与
VGGNet 来加强对小物体的检测。

视觉表征的通道并不是完全独立的。SIFT、HOG 和 GIST
的经典特征是符合分组特征的,其中每组信道由某种直方图(histogram)构成。这些特征通常通过在每个直方图或每个方向上执行分组归一化来处理。诸如
VLAD 和 Fisher Vectors
等高级特征也是分组特征,其中每一组可以被认为是关于集群计算的子向量。

大规模的多标签图像数据集的构建方法,包括图像的来源、图像候选类别集合、类别语义关系和图像的标注。在ML-Images的构建过程中,团队充分利用了类别语义关系来帮助对图像的精准标注。

马斯克称特斯拉车机将推出简要模式

文章的代码后续会公布到
contribute 到 mmdetection 中。

类似地,我们不需要将深层神经网络特征视为非结构化向量。例如,对于网络的第一个卷基层
conv1
,我们可以预期,滤波器及其水平翻转在自然图像上呈现类似的滤波器响应分布是合理的。如果
conv1
碰巧近似地学习到这对滤波器,或者通过将水平翻转设计到架构中,则这些滤波器的相应通道可以一起归一化。

相关文章

网站地图xml地图