#数据

2020-11-3 0:7
政府研究人员证实,冠状病毒大流行期间航空运输量的急剧下降,大幅减少了商业客机常规收集的大气数据量,从而影响了天气预报模型的质量。 在一项研究中,研究人员表明,当短期预测模型从飞机上收到的温度、风和湿度数据较少时,预测技能(预测的气象条件与实际发生的情况之间的差异)就会变得更差。 研究人员和其他人曾怀疑情况会是这样,因......
2020-11-1 21:42
在过去的二十年里,我们对软件开发有了一些深刻的理解。这在很大程度上要归功于DevOps的出现和整个行业的广泛采用。 领先的软件公司遵循相同的模式:软件开发中的快速迭代,然后是持续集成、持续交付、持续部署。每件工件都要通过测试其提供价值的能力,始终处于就绪状态,并通过自动化进行部署。 作为一个领域,机器学习不同于传统的......
2020-11-1 14:7
无论您使用的是逻辑回归还是神经网络,所有模型都需要数据才能进行训练、测试和部署。管理和创建用于这些模型的数据集需要大量的时间和空间,并且可能会由于多个用户更改和更新数据而很快变得混乱。 这可能会导致意想不到的结果,因为数据科学家继续发布新版本的模型,但针对不同的数据集进行测试。许多数据科学家可以在相同的几组训练数据上......
2020-11-1 12:48
Skan.ai,一个支持人工智能的流程发现和运营智能平台,今天完成了1400万美元的融资。该公司表示,所得资金将用于加快斯坎的上市和产品研发工作。 流程发现和自动化在企业中是可以理解的大生意。Forrester估计,机器人流程自动化(RPA)及相关子领域在2019年为40%的公司创造了就业机会。根据麦肯锡的一项调查,......
2020-11-1 2:12
让我们在周一之后,花一分钟时间来思考一下未来十年科技领域正在上演的趋势。虽然人类的问题从未像现在这样严重,但我们的工具从未像现在这样好过。丹尼·克莱顿(Danny Crichton)提供了更多信息: 2010年代的重点是实现移动、云和基础数据的梦想。这些想法在某些情况下可以追溯到几十年甚至更长时间(例如,万尼瓦尔·布......
2020-10-31 23:54
今年早些时候,联邦政府对疫情数据的报告方式做出了重大改变,将医院数据的汇总从疾病控制和预防中心(Centers for Disease Control and Prevention,简称CDC)转移到CDC的上级组织--卫生与公众服务部(Department of Health and Human Services,......
2020-10-31 23:50
芬兰一家大型心理治疗诊所的许多患者在他们的数据被盗后,被勒索者单独联系。 这些数据似乎包括个人身份记录和关于治疗过程中讨论的内容的笔记。 该公司表示,它认为这些数据在2018年11月被盗,2019年3月可能会进一步泄露。 据美联社(Associated Press News Agency)报道,黑暗网络上已经发布了大......
2020-10-31 2:2
SDLang是以文本形式表示数据的一种简单而简明的方式。它具有类似XML的结构-包括标记、值和属性-这使其成为数据序列化、配置文件或声明性语言的通用选择。它的语法灵感来自于C语言系列(C/C++、C#、D、JAVA、…)。。 //这是一个具有单个字符串值的节点";Hello,World";//支持多个值,......
2020-10-31 0:10
随着冠状病毒病例在全国范围内迅速上升,超过了春季和夏季的激增,卫生官员们准备迎接即将到来的住院和死亡浪潮。了解哪些社区的哪些医院正在达到容量可能是有效应对日益严重的危机的关键。这些信息是由联邦政府收集的-但不会公开与公众分享。 NPR已经获得了文件,这些文件提供了美国卫生与公众服务部每天收集和分析的数据的快照。这些文......
2020-10-30 22:59
在英国信息专员办公室的眼中,你的姓名、地址、电话号码、电子邮件地址、护照号码、出生日期和性别只值0.05英镑。在3.39亿人的数据从万豪酒店连锁店被盗后,英国信息专员办公室已经对万豪酒店处以1840万英镑的罚款。 这笔罚款是作为对2018年喜达屋酒店集团(Starwood Hotels)巨型酒店的监管惩罚,尽管万豪不......
2020-10-30 22:33
为了实现这一目标,政府一直在与Civis Analytics合作,Civis Analytics是丹·瓦格纳(Dan Wagner)创立的数据科学公司,他曾担任巴拉克·奥巴马(Barack Obama)2012年连任竞选的首席分析官。这场运动于8月份开始,但该州现在正在分享更多关于其工作的细节,包括一张地图,其中显示......
2020-10-30 12:28
PGSync是一个将Postgres中的数据毫不费力地同步到Elasticsearch的中间件,它允许您将Postgres作为您的真实源,并在Elasticsearch中创建结构化的非规范化文档。 对嵌套实体的更改会传播到Elasticsearch。PGSync的高级查询构建器随后会根据您的架构动态生成优化的SQL查......
2020-10-30 1:58
橡树岭领导力计算设施(OLCF)的计算科学家正在利用NVIDIA GPU计算能力和BlazingSQL(一种使用SQL语言进行GPU加速查询的新引擎)来大幅加快大数据分析,例如他们为新冠肺炎的药物发现工作所需的大数据分析。 OLCF已经与BlazingSQL,Inc.签订了合同。用于在OLCF峰会上部署、扩展和支持B......
2020-10-30 0:38
经过两年的专门设计和用户反馈,TimscaleDB 2.0终于问世了,它为时间序列数据库树立了一个新的标杆-而且它是完全免费的。 时间序列数据无处不在。无论您是在监控您的软件堆栈、用户、生产线、家庭、车辆、股票和加密货币组合、您家中的空气质量,还是只是在大流行期间监测您的健康状况,您都在收集时间序列数据。随着软件继续......
2020-10-29 23:7
根据PitchBook的一份报告,欧洲风险投资活动在2020年第三季度有所上升,这使得欧洲大陆有望创下年度风险投资活动总额(以欧元衡量)的新纪录。 该交易所探索初创企业、市场和资金。每天早上在Extra Crunch上阅读它,或者每周六获得Exchange时事通讯。 强劲的业绩发布之前,美国的风险投资活动经历了一个崩......
Defining Data Intuition(blog.harterrt.com)
2020-10-29 21:21
上周,我的一个同龄人让我解释一下我所说的数据直觉是什么意思,我意识到我真的没有一个好的定义。这是个问题!我一直在说数据直觉! 数据直觉是我面试新数据科学家的三项技能之一(还有统计学和技术技能)。事实上,我刚刚花了2020年的前九个月建立了Mozilla的数据直觉。我真的很惊讶地意识到,我无法很好地解释我正在努力培养的......
2020-10-29 20:24
在Pachyderm,我们正在构建一个开源企业级数据科学平台,使您可以部署和管理多阶段、语言无关的数据管道,同时保持完整的再现性和来源。如果您想更多地了解我们的宏伟愿景,请阅读我们的宣言。Pachyderm以开源为基础开发,通过提供可重复性、数据来源和真正协作的机会,改变了数据科学工作流程的范式。Pachyderm利......
2020-10-29 14:32
The Graph是一个服务于主要Defi客户的区块链数据项目,在一次迅速售罄的象征性销售中筹集了1200万美元。 The Graph是一家区块链数据公司,为Defi一些最受欢迎的应用程序提供服务,该公司在一次象征性的销售中筹集了1200万美元,仅在24小时多一点的时间内就销售一空。 Graph基金会今天宣布,以12......
2020-10-28 19:1
近二十年来,来自土星卫星土卫六的异常明亮的雷达反射一直困扰着科学家。发表在“自然通讯”上的一项新研究终于解开了这个谜团。喷气推进实验室的主要作者Jason Hofgartner博士说:“利用来自NASA卡西尼号任务的新证据,我们能够重启科尔德案件。”“我们的调查显示,异常明亮的反射很可能来自干燥的古代湖泊,也就是所谓......
2020-10-28 7:16
任何运行Apache Kafka数据基础设施并运行在Kubernetes上的人,都有可能以这种方式定义您的基础设施。 如果您在Kubernetes上运行,您可能会使用操作符作为CI/CD工具链的一部分来自动化部署。 采用GitOps是自然发展,因此您的环境的状态在Git(或任何代码库)中进行管理,自动化系统确保部署的......
2020-10-28 2:47
我为科技界写了一份行动号召,让他们在未来十年更深入地研究创新的未来。不过,一些热点将从哪里来呢?下面,我整理了一组非常松散的五个集群,大致分为“健康”、“气候”、“数据社会”、“创造力”和“基本面”,这些都是[…]
2020-10-28 0:9
正如联合创始人兼首席执行官文卡特·文卡塔拉马尼(Venkat Venkataramani)在2018年首轮比赛时告诉我的那样,让数据准备好使用需要大量的人工工作,这是获得真正洞察力的障碍。他希望用Rockset来改变这一点。 我们正在用创新的架构和独特的功能来构建我们的服务,这些功能可以直接在原始数据上实现全功能的F......
2020-10-27 23:25
这家成立于2015年的公司在很大程度上坚持了其最初的愿景,即始终致力于将数据仓库的访问民主化,以及与之齐头并进的分析能力。在过去的几年里,它还在平台中构建了更多的无代码数据集成,使企业更容易从各种来源获取数据,包括Salesforce、HubSpot、NetSuite、Xero、Quickbook、FreshWork......
2020-10-27 20:40
实时分析初创公司Rockset今天宣布了一轮4000万美元的融资。该公司表示,这笔资金将用于增加员工队伍,加快产品开发和研究,同时支持其上市努力。 Domo 2018年的一份报告估计,人类每天创造2.5万亿字节(或2.5艾字节)的数据,这个数字从那以后只会增加。也许并不令人惊讶的是,一些公司比其他公司更有效地利用数据......
2020-10-27 5:50
要使用数据,您需要对其具有访问权限。如果你是银行,那就意味着交易和账户;如果你是零售商,那就意味着库存和供应链等等。在所有这些数据中隐藏着大量的洞察力和可操作的模式,这是数据科学家和他们的同类的工作,把它们提取出来。 但是,如果您无法访问数据怎么办?毕竟,有许多行业这样做是不被建议的,甚至是非法的,比如医疗保健行业。......
2020-10-26 23:56
据参议员罗恩·怀登(Ron Wyden)的办公室称,美国海关和边境保护局拒绝告诉国会,该机构在没有搜查令的情况下,使用商业购买的位置数据来追踪美国人,这是遵循什么法律权威。该机构正在从全国各地的美国人那里购买位置数据,而不仅仅是在边境地区。 由于没有披露为什么CBP认为使用这些数据不需要搜查令,以及国土安全部(Dep......
PG&E Outage Map(www.sfchronicle.com)
2020-10-26 13:17
这张PG&Amp;E停电地图显示了北加州的实时停电区域。您可以在这一页上检查您的地址。 关于本项目实时停电数据和潜在的公共安全断电区域数据来自PG&;E,每15分钟更新一次,或在馈送可用时更新。要报告地图上没有的停机情况,请访问他们的网站。与公用事业相关的火灾风险区数据来自加州公用事业委员会的火灾威胁地图。
2020-10-25 23:7
每年,世界产生的数据都比前一年更多。根据国际数据公司(International Data Corporation)的数据,仅在2020年,估计就会有59 ZB的数据被“创建、捕获、复制和消费”-足以装满大约1万亿个64G的硬盘。 但是,仅仅因为数据激增并不意味着每个人都能真正使用它们。公司和机构出于对用户隐私的理所......
2020-10-25 23:4
本周五,芬兰人对一起丑闻的结果感到震惊,这起丑闻是一群黑客敲诈一家为公共卫生系统提供心理治疗中心服务的私人公司造成的。 在一个自称走在数字化和数据安全前沿的国家,犯罪分子在检测到系统中的漏洞后,设法访问了Vastaamo公司数千名客户的数据库。 据其网站介绍,Vastaamo为患有抑郁症和焦虑症等疾病的患者提供心理和......
2020-10-23 12:7
我只是想把这个扔出去。我们已经收到了大量关于数据上限的内部电子邮件。现在看来,从12月1日起,CL应用于DSL连接的1TB上限现在将适用于光纤连接。根据他们告诉我们的内容,客户将在11月中旬通过电子邮件收到有关政策变更的通知,其中将包括FTTH客户的1 TB上限。他们没有提到任何无限数据选项,除了1G/1G每月199......