丑陋:来自FB研究的新多峰数据增强库

2021-06-18 21:08:34

盖因是一个数据增强库,目前支持四个模态(音频,图像,文本&视频)和超过100个增强。每个模态的增强都包含在自己的子图书馆内。这些子库包括基于函数和基于类的转换,构图运算符,并可以选择提供有关应用的变换的元数据,包括其强度。

盖因是一个伟大的图书馆,可以利用在模型培训中增加数据,或评估模型的稳健性差距!我们以旨在包括许多特定数据增强的特定数据增强,用户在Facebook&#39等互联网平台上的现实生活中执行 - 例如在图像/视频上覆盖文本/ emojis,从社交媒体中重新发布截图。虽然以速度包含更多通用数据增强,但如果您'重新撰写副本检测,讨厌语音检测或版权侵权,那么它将特别适用于这些"互联网用户"数据增强类型是预先存在的。

要查看更多的增强示例,请在README中打开COLAB笔记本电脑,为每种方式! (例如图像Readme& Colab)

或者克隆刚才如果要能够运行我们的单位测试,贡献拉索请求等:

git clone [email protected]:FacebookResearch / Athly.git [可选,但推荐]公园Create-N AGLY&&&公园激活了AGLY& Conda安装pippip安装-e ably /

注意:在某些环境中,PIP' T按预期安装Python-Magic。在这种情况下,您需要另外运行:

我们提供各种媒体资产以与我们的一些增强一起使用。这些资产包括:

Emojis(Twemoji) - 版权所有2020 Twitter,Inc等贡献者。在麻省理工学院许可证下许可的代码。在CC-BY 4.0下许可的图形。

字体(NOTO字体) - NOTO是谷歌公司的商标.NOTO字体是开源的。所有Noto字体都在SIL Open Font许可证版本1.1下发布。

屏幕截图模板 - 由Facebook的设计师创建的图像专门用于以速度使用。您可以使用它们在图像和视频库中的overlay_onto_screenshot增强,以使其看起来像您的源图像/视频在类似于Facebook或Instagram的社交媒体饲料中截图。

@misc {bitton2021augly,作者= {bitton,乔安娜和papakipos,zoe},标题= {evly:一个音频,图像,文本和视频的数据增强库。 },如何发表= {\ url {https://github.com/facebookresearch/augly}},年= {2021}}

以速度为许可,如许可证文件所示。请注意,AGILLY使用的一些依赖项可能会在不同的术语下获得许可。