面向机器学习项目的开源版本控制系统

2020-07-25 21:15:02

DVC是为了使ML模型可共享和可重现而构建的。它旨在处理大型文件、数据集、机器学习模型、指标以及代码。

版本控制机器学习模型、数据集和中间文件。DVC通过代码将它们连接起来,并使用Amazon S3、Microsoft Azure Blob Storage、Google Drive、Google Cloud Storage、阿里云OSS、SSH/SFTP、HDFS、HTTP、网络连接存储或光盘来存储文件内容。

完整的代码和数据来源有助于跟踪每个ML模型的完整演变。这保证了重复性,并使得在实验之间来回切换变得容易。

利用Git分支的全部功能来尝试不同的想法,而不是在代码中使用草率的文件后缀和注释。使用自动度量跟踪来导航,而不是纸和铅笔。

无论数据文件大小如何,DVC的设计都能保持与Git中一样简单快速的分支。伴随着一流的公民指标和ML管道,这意味着一个项目拥有更干净的结构。比较想法并挑选最好的很容易。使用中间工件缓存,迭代会变得更快。

使用Push/Pull命令将一致的ML模型、数据和代码包移动到生产环境、远程计算机或同事的计算机中,而不是临时脚本。

DVC在Git中引入了轻量级管道作为一级公民机制。它们与语言无关,并将多个步骤连接到DAG中。这些管道用于消除将代码投入生产过程中的摩擦。

使用Push/Pull命令将一致的ML模型、数据和代码包移动到生产环境、远程计算机或同事的计算机中,而不是临时脚本。

DVC在Git中引入了轻量级管道作为一级公民机制。它们与语言无关,并将多个步骤连接到DAG中。这些管道用于消除将代码投入生产过程中的摩擦。

版本控制机器学习模型、数据集和中间文件。DVC通过代码将它们连接起来,并使用Amazon S3、Microsoft Azure Blob Storage、Google Drive、Google Cloud Storage、阿里云OSS、SSH/SFTP、HDFS、HTTP、网络连接存储或光盘来存储文件内容。

完整的代码和数据来源有助于跟踪每个ML模型的完整演变。这保证了重复性,并使得在实验之间来回切换变得容易。

利用Git分支的全部功能来尝试不同的想法,而不是在代码中使用草率的文件后缀和注释。使用自动度量跟踪来导航,而不是纸和铅笔。

无论数据文件大小如何,DVC的设计都能保持与Git中一样简单快速的分支。伴随着一流的公民指标和ML管道,这意味着一个项目拥有更干净的结构。比较想法并挑选最好的很容易。使用中间工件缓存,迭代会变得更快。

使用Push/Pull命令将一致的ML模型、数据和代码包移动到生产环境、远程计算机或同事的计算机中,而不是临时脚本。

DVC在Git中引入了轻量级管道作为一级公民机制。它们与语言无关,并将多个步骤连接到DAG中。这些管道用于消除将代码投入生产过程中的摩擦。

版本控制机器学习模型、数据集和中间文件。DVC通过代码将它们连接起来,并使用Amazon S3、Microsoft Azure Blob Storage、Google Drive、Google Cloud Storage、阿里云OSS、SSH/SFTP、HDFS、HTTP、网络连接存储或光盘来存储文件内容。

完整的代码和数据来源有助于跟踪每个ML模型的完整演变。这保证了重复性,并使得在实验之间来回切换变得容易。

利用Git分支的全部功能来尝试不同的想法,而不是在代码中使用草率的文件后缀和注释。使用自动度量跟踪来导航,而不是纸和铅笔。

无论数据文件大小如何,DVC的设计都能保持与Git中一样简单快速的分支。伴随着一流的公民指标和ML管道,这意味着一个项目拥有更干净的结构。比较想法并挑选最好的很容易。使用中间工件缓存,迭代会变得更快。

使用Push/Pull命令将一致的ML模型、数据和代码包移动到生产环境、远程计算机或同事的计算机中,而不是临时脚本。

DVC在Git中引入了轻量级管道作为一级公民机制。它们与语言无关,并将多个步骤连接到DAG中。这些管道用于消除将代码投入生产过程中的摩擦。

在任何时候,获取关于你或你的同事所做的任何实验的全部背景信息。DVC保证所有文件和度量都是一致的,并且位于正确的位置,以重现实验或将其用作新迭代的基线。

DVC将图元文件保存在Git中,而不是Google Docs中,以描述和版本控制您的数据集和模型。DVC支持多种外部存储类型作为大型文件的远程缓存。

DVC定义了团队高效一致工作的规则和流程。它充当在生产环境中协作、共享结果以及获取和运行成品模型的协议。

在任何时候,获取关于你或你的同事所做的任何实验的全部背景信息。DVC保证所有文件和度量都是一致的,并且位于正确的位置,以重现实验或将其用作新迭代的基线。

DVC将图元文件保存在Git中,而不是Google Docs中,以描述和版本控制您的数据集和模型。DVC支持多种外部存储类型作为大型文件的远程缓存。

DVC定义了团队高效一致工作的规则和流程。它充当在生产环境中协作、共享结果以及获取和运行成品模型的协议。