“讲述人”筹集了620万美元,用于一种取代星型模式的新数据建模方法

2020-09-17 15:24:56

这笔融资由Initialized Capital牵头,以及Flybridge Capital Partners和Y Combinator-这家初创公司在2019年的队列中-以及包括保罗·布赫海特(Paul Buchheit)在内的新投资者的持续投资。

Narrative已经存在了三年,但其第一阶段的基础是作为咨询公司直接向公司提供建模和分析,帮助公司将来自全球营销、CRM、支持部门和内部数据库的不同的结构化数据源整合为一个统一的整体。作为顾问,该公司首席执行官艾哈迈德·埃尔萨马迪西表示,他和其他人都是“单枪匹马地”查询“八家大公司”的信息,而深度分析则是由另一个人完成的。该公司使用的是该公司目前正在推出的工具的早期版本。

在验证了它的有效性后,新的自助版本旨在为数据科学家和分析师提供一种简化的数据排序方式,以便能够快速-几小时而不是几周-对这些数据进行快速、一致的查询。这些查询被描述为可操作的分析,采用了类似故事的格式-或者公司称之为“叙事”。(你可以在下面看到该公司数据主管布列塔尼·戴维斯(Brittany Davis)提供的它是如何工作的演示。)。

(新的数据即服务也在SaaS级别中定价,前500万行数据为免费级别,之后根据数据行、用户数量和使用中的描述进行滑动定价。)。

Elsamadisi与Matt Star、Cedric Dussud和Michael Nason共同创立了这家初创公司,他说,数据分析师长期以来一直在忍受星型模式建模(以及相关格式的雪花模式)的问题,这些问题可以概括为“层层依赖、缺乏真理来源、数字不匹配以及无休止的维护”。

“其核心是,当您有很多由许多复杂SQL构建的表时,最终会得到一个不断增长的纸牌屋,需要不断雇佣更多的人来帮助确保它不会崩溃。”

正是在他担任WeWork首席数据科学家期间-是的,他告诉我,也许这不是一家真正的科技公司,但它拥有“技术核心”-他意识到如何重组数据以绕过这些问题,这是一个突破性的时刻。

在此之前,数据方面的情况很艰难。WeWork有700个表,他的团队使用星型架构方法管理,覆盖85个系统和13,000个对象。数据将包括收购大楼的信息,通过这些大楼的客户流量,情况将如何变化,客户可能会流失,社交网络上的营销和活动,等等,与公司自己快速扩张的帝国保持一致。但所有这一切都意味着数据端一团糟。

“数据分析师将无法胜任他们的工作,”他说。“事实证明,我们甚至连有关销售数字的基本问题都回答不了。没有一件比得上,而且所有的事情都花了太长时间。“。

该团队有45个人,但即便如此,它最终不得不实现回答问题的层次结构,因为问题太多,没有足够的时间来挖掘并回答所有问题。“我们拥有所有可用的数据工具,”他补充道。“我的团队讨厌他们所做的一切。”

他说,叙述者使用的单表栏目模式在过去“已经被理论化”,但还没有被弄清楚。

他说,其中的火花是以我们提出问题的同样方式来思考数据的结构,正如他所描述的那样,每一条数据都可以桥接在一起,然后也可以用来回答多个问题。

Elsamadisi解释说:“主要的区别是我们使用了时间序列表来取代您所有的数据建模。”“这不是一个新想法,但一直被认为是不可能的。”简而言之,我们和大多数数据公司解决了同样的问题,让你更容易获得你想要的数据,但我们是唯一家通过创新最低级别的数据建模方法来解决这个问题的公司。老实说,这就是我们的解决方案如此有效的原因。我们重建了数据的基础,而不是试图让有问题的基础变得更好。“。

讲述人调用复合表,该复合表包括重新格式化以适应其11列结构的所有数据,即活动流。

Elsamadisi说,第一次使用叙述者大约需要30分钟,大约一个月的时间才能学会彻底使用它。“但在那之后你就不会再用SQL了,它要快得多,”他补充道。

“旁白”最初的市场一直在为其他科技公司提供服务,特别是初创公司,但计划向更广泛的垂直市场开放。从长远来看,它还计划将一些核心组件开源,以便第三方可以更快地将产品数据放在框架上,这一举措可能会对此有所帮助。

至于竞争对手,他说,这本质上是他和其他数据科学家一直在使用的工具,尽管“我们反对的是‘最佳实践’方法(星型模式),而不是一家公司。”他补充说,Airflow、DBT、Looker‘s LookML、Chartio的Visual SQL、Tableau Prep都是创建和启用传统星型模式的方法。我们与这些公司类似-努力使其尽可能简单高效地生成BI、报告和分析所需的表-但这些公司受到传统星型架构方法的限制。

到目前为止,证据都在数据中。叙述者说,公司平均约有20次转换(用于回答问题的单位),而星型模式为数百次,这些转换平均为22行,而传统建模为1000多行。对于那些学习如何使用它的人来说,生成报告或运行某些分析的平均时间为4分钟,而传统数据建模需要数周时间。

​初始化资本首席运营官、合伙人兼新的叙述者董事会成员​的珍·沃尔夫在一份声明中表示:“叙述者有可能在数据方面设定一个新的标准。”“我们惊讶地看到叙述者使用他们的产品进行分析的质量和速度。我们相信,一旦世界经历叙述者,这将是教数据分析向前发展的方式。“