在2020年离开Quandopian之后,发生了一些有趣的事情:各公司联系了我,致电接近他们的Pymc3型号帮助他们。
通常,我不听听人们如何使用Pymc3 - 他们大多出现在Github或话语上,当时练功。所以,听到所有这些真正酷的项目非常令人兴奋。但是,我无法自己采取所有这些项目。
因此,是时候组装了一个全球曾经见过的最多Badass贝叶斯建模者的团队 - 如果你愿意的话,贝内亚养老界家。幸运的是,随着Pymc3已经吸引了这些类型的人,我不必冒险。
这将让我提出大公告:在过去的几个月里,我们悄然地建造了Pymc Labs,这是一个贝叶斯建模咨询。我们有一个惊人的团队,包括三个神经科学博士,数学家,社会科学家,一个太空火箭科学家,以及着名的“学习贝叶斯统计”播客的主人。我们所有人都在团结在我们的使命:
这听起来有点宏伟吗?大概。这是真的?我坚信它是。今天有许多重要的问题 - 从气候变化到Covid19,从教育到贫困,贝叶斯建模可以在解决这些问题方面发挥焦度作用。让我解释原因。
当我开始为PYMC做出贡献时,我不会想象它,但科学PYMC3直接启用了气候科学和生物学的范围,以及两者之间的一切。
例如,它用于预测Covid19在最近的科学论文中的扩散,以及实时跟踪再现因子。在这两种情况下,PymC3的益处是其易用性和整合的能力科学域名知识并在高度挥发和不确定的情况下诚实的不确定性估算。
现在我知道你非常敏锐,我听到你的想法:“等一分钟,那些贝叶斯建模的好处的好处,为什么他们只对流行病学有效?”。事实上他们不是!对于类似的福利,Pymc3还用于在太阳系之外找到地球检测地震。我的一位在Pymc Labs的同事使用它为选举和政治预测使用它,因为民意调查嘈杂,稀缺,需要通过域知识完成 - Forbayesian推论的完美设置之一!
通过所有这一点,在撰写本文时,Pymc3纸张已被引用超过930倍,并位于整个Peerj杂志的十大最引用的文章中。
除了科学研究之外,我发现Pymc3是解决各种业务问题的完美工具。确实已经成功地在公司的大多数与太空,罗氏,Netflix,verifero和Hellofresh公司生产的公司生产。
这种多样性意味着Pymc Labs团队介入例如从最新财经研究建立复杂的模型;优化供应链的食物交付;从上到下构建软件,用于制药应用;加速和扩展农业技术产业的模型;培训并增强任何数据科学团队的贝叶斯统计空间等等。
随着数据科学在过去十年中爆发,我一直对预倒调的预测集中的学习感到惊讶。对于我们的数据科学问题的大多数人来说,它被称为解决方案。
我相信这是普遍的方式。不是因为它不起作用 - Deply Nets orrandom森林等算法在从大数据集中提取非线性预测模式时非常强大 - 但是由于大多数数据科学问题并不简单的预测,而是推理问题。
此外,我们经常已经有很多关于我们问题的知识:对我们数据集中的某些结构的知识(如嵌套数据,即某些变量与某些但不是其他参数相关)和我们预期我们期望某些参数的范围的范围模型落入。预测聚焦的mL不允许我们包括此信息的任何内容,即为什么需要这么多数据。
与贝叶斯统计数据,我们不必从数据转换为自定义模型时都要从数据中学习一切.Thus,而不是改变我们的问题,以适应解决方案,就像ML一样,我们可以定制解决方案Bestsve手头的问题。我喜欢用PlayMobil比较这个vs Lego:
Playmobil只给了你一个玩具,你可以'乐高(这里的贝父)改变了改变,给你构建块来构建你实际上想要的玩具。在贝叶斯建模中,这些构建块是概率分布。
但是你如何在实践中做到这一点?这是Pymc3进来的地方,因为它允许您将模型指定为Pythoncode并自动估计它而不需要手动数学推导。由于最近的理论和技术进步,这也很快运行并缩放到大(ISH)数据集的复杂模型。
首先,我们将继续使Pymc3成为最好的,最用户友好且可扩展的贝叶斯建模包。我们设置得很好,可以做到这一点,拥有友好的API,一个庞大的用户库和一个大型开发者团队20个ActiveMembers。随着我们在Theano上的Pymc3上重新关注Theano,JAX Backendall我们的资源将走向这一目标。
其次,我们的新PYMC咨询公司将支持这一努力。它允许我们直接帮助客户使用这些强大,可定制的方法来解决他们的业务问题,从而提高采用和识别。尽管有很大的副作用,但这些客户项目也有助于我们找到需要修复,改进或优化的东西,改进或优化Pymc3,从而提升所有(贝叶斯)船而不是幸福的船只。
到目前为止,这一直是一个令人难以置信的奖励和令人振奋的旅程。即使它仍然很早,我们也是贝叶斯建模的课程尤其适合,但也会更好地制作Pymc3甚至更好的东西。在破坏一个未来的博客文章,这将更详细地详细介绍我们学到了应用这些方法的内容,最佳使用情况包括(但不限于)包含域知识,构建定制模型并限定估计周围的不确定性。
听起来很熟悉?如果您或您的公司对哪种基于预测的ML有一个不好的契合,请在[email protected]上谈谈您。这只是一个开始,希望你能加入我们这个奇妙的旅程。