IBM新的差分保密库只需一行代码即可工作

2020-06-28 22:34:44

今年,在其230年的历史上,美国人口普查将首次使用不同的隐私,以便在数据公开时对公民的回答保密。但是它是如何工作的呢?

差别隐私使用数学噪声来保护个人的隐私和机密性,同时允许观察总体统计数据。这一概念是对机器学习的自然扩展,在机器学习中,我们可以保护模型免受隐私攻击,同时保持总体准确性。

例如,如果你想知道我的年龄(32岁),我可以从帽子中随机选择一个数字,比如说±7-你只会知道我的年龄可能在25到39岁之间。为了保护我的年龄,我在数据中增加了一点噪音,美国人口普查局也会做类似的事情。

虽然美国政府构建了自己的差异隐私工具,但IBM一直在开发自己的开源版本,今天我们将发布最新版本v0.3。IBM Differential Privacy Library拥有一套用于机器学习和数据分析任务的工具,所有这些工具都具有内置的隐私保障。

我们的库让科学家和开发人员能够在熟悉的环境中访问轻量级、用户友好的数据分析和机器学习工具,这一点与其他库相比是独一无二的-事实上,大多数任务只需一行代码即可运行。

使我们的图书馆与众不同的还有我们的机器学习功能,它使组织能够以前所未有的方式严格保证用户隐私,发布和共享他们的数据。

随着v0.3的技术细节,图书馆现在配备了一名预算会计,以跟踪不同操作的隐私预算支出。使用先进的组合技术,预算会计允许用户提取比更简单的会计方法更多的洞察力,虽然很难量化,但在典型的工作负载下,隐私预算节省超过50%的情况并不少见。

我们的图书馆包括一系列功能,可以从数据中提取洞察力和知识,并提供强大的隐私保证。我们专注于为最流行的算法开发解决方案,包括直方图、逻辑回归、k-均值聚类和主成分分析(PCA),并为开发人员提供差异隐私的基本构件,使他们能够开发自己的自定义解决方案。

该库包括当前可用的类似库中不存在的以下关键组件:

机制:全面收集差异隐私的基本构件,用于构建新的工具和应用程序;

还包括一组用于数据探索和分析的基本工具。该库入门的所有细节都可以在IBM的Github库中找到。

DiffPrilib:The IBM DiffPrivacy Library,Naoise Holohan,Stefano Braghin,Pól Mac Aonghura,Killian Levacher。

众所周知,人体主要是由水组成的:例如,大脑有75%是水,甚至骨头也不是“干的”--含有多达三分之一的水。所有这些水都维持着生物细胞的形状和结构,并参与了许多生化过程。IT[…]。

通常,当我第一次开始向某人解释完全同态加密(FHE)时,我一开始就会说,我在这个领域已经工作了近十年,但我仍然必须停顿一下才能正确拼写它。那么,我们就叫它fhe吧。半开玩笑不说,当你[…]。

我们在苏黎世的IBM欧洲研究所的团队和以色列Technion的合作者共同进行的研究,导致了一种从小体积样本中分离颗粒和分子的新方法。这项技术利用了扩散率的差异-扩散率是一种与大小密切相关的分子特性。我们目前正在将该方法应用于快速[…]