TAG:数据

Disney Animation data sets (2018)(blog.yiningkarlli.com)
2020-10-20 22:36
今天在EGSR 2018年上,华特迪士尼动画工作室宣布发布两个用于渲染研究的大型制作质量/比例数据集。数据集可在迪士尼动画官方网站的新数据集页面上找到。第一个数据集是云数据集,其中包含一个大型且高度详细的体云数据集,我们在SIGGRAPH 2017论文中使用了该数据集,第二个数据集是莫阿纳岛场景,这是Moana的完整......
2020-10-20 22:11
如今,在大卫·萨克斯(David Sacks)、Slake、Gradient Ventures、Y Combinator和其他个人投资者的260万美元种子投资的帮助下,他们可以继续实现这个梦想。 吸引这项投资的是几位年轻的创始人,他们热衷于让构建数据仪表盘变得简单,而不需要工程师或数据分析师等专家的帮助。 “从本质上......
2020-10-20 2:23
Datasette(以前)是我用于浏览和发布结构化数据的开源工具。在Datasette中嵌入了很多想法。我意识到我并没有把很多东西写下来。 Datasette为您的数据提供只读API。它不尝试处理写入。完全避免写入是众多有趣属性的基础,其中许多属性将在下面进一步展开。简而言之: 在2018年,托管没有读/写持久性要求......
2020-10-19 21:5
其中一些听起来可能很熟悉,因为对于文档人工智能,Google Cloud已经提供了一个更通用的工具,用于在复杂文档上执行OCR,然后从这些文档中提取数据。Lending DocAI实质上是第一个使用该技术的垂直专业化Google Cloud服务。 谷歌产品经理Sudheera Vanguri写道:“我们的目标是为您提......
2020-10-19 20:8
新加坡将成为世界上第一个在国家身份证计划中使用面部验证的国家,但隐私权倡导者对他们所说的容易被滥用的侵入性系统感到震惊。 从明年开始,生活在这个城市国家的数百万人将能够通过快速面部扫描获得政府机构、银行服务和其他便利设施。 这种生物识别检查的发明者说,在执行许多日常任务时,这种生物识别检查将不再需要记住密码或安全加密......
2020-10-19 15:27
在斯坦福大学普雷库特能源研究所(Stanford University‘s Precourt Institute for Energy)的一个实验室里,有六个冰箱大小的橱柜,旨在尽可能快地耗尽电池。每个都可以容纳大约100个锂离子电池,固定在托盘中,每天可以对电池进行数十次充放电。通常情况下,进入这些电化学刑讯室的电......
2020-10-19 3:55
机器学习通常需要大量的例子。要让人工智能模型识别一匹马,你需要向它展示数以千计的马的图像。这就是这项技术在计算上昂贵的原因-而且与人类学习有很大的不同。孩子通常只需要看到几个物体的例子,甚至只有一个,才能终生识别它。 事实上,孩子们有时不需要任何例子来识别东西。他们展示了一匹马和一头犀牛的照片,并告诉他们独角兽介于两......
2020-10-19 2:35
作为数据工程师,您将编写大量代码来处理各种业务案例,如ETL、数据流水线等。事实上,数据工程的标准语言是Python(不要与用于数据科学的R或NIM混淆,它们在数据工程中没有任何用处)。 RDBMS是任何应用程序数据的基本构建块。数据工程师应该知道如何设计和设计其结构,并了解与其相关的各种概念。 NoSQL是任何非关......
2020-10-18 8:53
作为一个行业,我们非常擅长构建大型、复杂的软件系统。我们现在开始看到围绕数据构建的大规模复杂系统的兴起--系统的主要业务价值来自数据分析,而不是直接来自软件。我们看到这一趋势对整个行业的快速影响,包括新角色的出现,客户支出的转变,以及围绕数据提供基础设施和工具的新初创公司的出现。 事实上,许多当今增长最快的基础设施初......
2020-10-18 8:1
旧金山初创公司Cribl Inc.。今日表示,它已经筹集了3500万美元,由红杉资本(Sequoia Capital)牵头,让公司在使用哪些基础设施监控工具方面有更大的灵活性。 技术环境会生成大量机器数据,这些数据对于检测停机和查找安全漏洞等任务非常有用。市面上有很多监控工具承诺帮助解锁这些数据的价值。然而,公司经常......
2020-10-17 2:8
信息专员办公室(ICO)对英国航空公司(British Airways)处以2000万英镑(约合2600万美元)的罚款,原因是一起数据泄露事件影响了40多万名客户。 这笔罚款比ICO最初表示打算在2019年开出的1.83亿GB要小得多。 这起事件发生时,英航的系统被攻击者攻破,然后在输入客户详细信息时进行修改,以获取......
2020-10-16 20:19
信息专员办公室(ICO)对英国航空公司(British Airways)处以2000万英镑(约合2600万美元)的罚款,原因是一起数据泄露事件影响了40多万名客户。 这笔罚款比ICO最初表示打算在2019年开出的1.83亿GB要小得多。 这起事件发生时,英航的系统被攻击者攻破,然后在输入客户详细信息时进行修改,以获取......
2020-10-16 3:59
虚拟现实(VR)是一项正在消费者市场获得吸引力的技术。随之而来的是一种前所未有的跟踪身体运动的能力。这些身体动作是对个人身份、医疗条件和精神状态的诊断。以前的工作集中在理想化情况下身体运动的可识别性,在这种情况下,研究设计者选择了一些动作。相比之下,我们的工作是在典型的VR观看环境下测试用户的可识别性,没有专门设计识......
2020-10-16 2:14
招聘中的本能感觉和“随心所欲”应该谨慎对待,决策应该始终基于你准确指出的与角色相关的证据。
2020-10-16 1:2
对于周四的第一次出版,我想和你们大家一起做一个“如果”的练习。他们说,这种“如果”技术就是Spotify等公司使用的技术(“如果你不必拥有自己的音乐库呢?”)。优步(Uber)(“如果每辆车都有可能变成出租车会怎么样”)达到他们目前的模式。 所以让我们试一试同样的东西。让我们问问自己:“如果互联网先离线会怎么样?如果......
2020-10-16 0:35
我们正在扩展您可以使用Workers构建的内容,以包括需要跨多个Workers和存储使用同步的用例-这些用例是Workers KV无法解决的。 同步访问:针对特定持久对象的每个Worker请求都被路由到同一实例,从而允许跨多个Worker进行协调。 可伸缩性:单个持久对象的开销几乎为零。应用程序可以一次将数据访问分散......
2020-10-15 6:5
我一直在开发一个应用程序,它的核心是存储大量数据,这些数据主要是通过使用外键和时间戳字段来组织的。表自己的主键是基于UUID的,将外键与单个记录本身的UUID组合在一起,并且它有一个使用JSONB类型的主数据字段,因为它可以接收任意数据。该表可以看到频繁的、定期的插入和周期性的删除,旧数据会随着时间的推移而变得稀疏,......
2020-10-14 20:54
谷歌网络分析平台的最新版本名为谷歌分析4(Google Analytics 4),现已面世。新的属性类型包括扩展的预测洞察力、与谷歌广告的更深入集成、跨设备测量功能和更精细的数据控制。 周三宣布的这一版本是对去年推出的App+Web属性的扩展和品牌重塑,标志着超越Universal Analytics迈出了重要的第一......
2020-10-14 1:2
我们谈论的是雪花大战AWS,数据仓库,以及数据让决策者无能为力。 AWS与Databricks和Snowflake等公司之间的动态是我以前想知道的。很难不这样做,因为AWS拥有自己的产品,是Databricks(EMR)和Snowflake(RedShift)的直接竞争对手。与此同时,Databricks和Snowf......
2020-10-13 23:45
研究人员正在建立多样化的训练数据集,其中包括来自视力低下者和患有ALS等疾病的人的信息。 盲人或使用轮椅或患有自闭症的人通常是技术的早期采用者,以完成日常任务,如交流、阅读和旅行。人工智能为其中许多服务提供动力,如语音和对象识别。在许多情况下,这些产品都是根据来自健全人或神经官能者的数据进行训练的。这意味着算法可能对......
2020-10-12 21:59
9月底,在一如既往的秋季硬件发布会中,亚马逊在五天内推出了两款特别具有未来主义风格的产品。第一架是一架小型自动监视无人机“Ring Always Home Cam”,它在充电码头内耐心等待,最终会升起并在你家周围飞行,检查你是否把炉子开着,或者调查潜在的入室盗窃事件。第二个是手掌识别扫描仪,亚马逊一号(Amazon ......
2020-10-12 21:39
欧洲科学家周三宣布,在全球范围内,上个月是有记录以来最热的9月,超过了一年前创下的纪录。 这也是欧洲有记录以来最热的9月。西伯利亚北部、西澳大利亚、中东和南美部分地区的气温也同样高于平均水平。 这一声明是由欧盟支持的政府间机构哥白尼气候变化服务机构(Copernicus Climate Change Service)......
2020-10-12 7:11
任何数据分析工作流程中的第一个任务就是简单地读取数据,这绝对必须快速有效地完成,这样才能开始更有趣的工作。在许多行业和领域,CSV文件格式是存储和共享表格数据的王道。快速可靠地加载CSV至关重要,它必须能够很好地扩展到各种文件大小、数据类型和形状。这篇文章比较了在三个不同的CSV解析器上读取8个不同的真实世界数据集的......
2020-10-11 18:10
散点图。你可能不知道他们的名字,但如果你在网上花10分钟以上,你会发现他们无处不在。它们在新闻文章中很受欢迎,在数据科学界也很受欢迎,也许最关键的是,它们在互联网上传播了关于煎饼消化质量的模因。 通过将数据描述为两个轴上的大量点,散点图在可视化趋势、相关性和异常方面非常有效。但是,将它们用于大型数据集通常会导致重叠的......
2020-10-11 18:7
本周,英国测试和跟踪基础设施的一个关键部分严重失败。近一万六千名新冠肺炎感染者的所有接触者都被允许在不知情的情况下在社区内传播了整整七天。那大约是5万人。 我不会抱怨英国公共卫生(PHE)使用EXCEL合并每个测试中心的测试结果。那显然是错的。 这涉及到更令人担忧的事情:我不明白为什么没有适当的监测到位。这是技术领导......
2020-10-7 17:36
在英国,近16000例冠状病毒病例没有上报,原因是对微软Excel软件的使用考虑不周。 而且似乎应该归咎于英国公共卫生(PHE),而不是第三方承包商。 这个问题是由该机构将商业公司制作的日志汇集在一起的方式引起的,这些公司付钱分析公众的拭子测试,以发现谁感染了病毒。 他们以基于文本的列表-称为CSV文件-的形式提交了......
2020-10-7 16:26
如果你在市场上寻找新的手机套餐,最好不要求助于Boom!莫比尔县。也就是说,除非你不介意你的敏感支付卡数据在过去几个小时内仍在进行的攻击中被发送给犯罪分子。 据安全公司Malwarebytes的研究人员称,砰!研究人员称,MobileBoom.us网站感染了一个恶意脚本,该脚本掠过支付卡数据,并将其发送到一个名为Fu......
2020-10-7 15:16
数据谱系自动化平台Manta今天完成了由Bessemer Venture Partners牵头的1300万美元的系列A1融资。MANTA表示,随着寻求向新领域扩张,它将把资金用于劳动力增长和产品开发。 数据沿袭包括数据的来源、发生了什么以及随着时间的推移移动到哪里,提供了更好的可见性,并且更容易将错误追溯到根本原因。......
2020-10-7 15:14
据Motherboard获得的一封信的副本显示,负责监督美国国税局的机构在一封信中宣布,它将调查国税局使用安装在人们手机上的普通应用程序收集的位置数据。 此前,参议员罗恩·怀登(Ron Wyden)和伊丽莎白·沃伦(Elizabeth Warren)要求对美国国税局(IRS)如何在没有搜查令的情况下使用位置数据追踪美......
2020-10-7 14:57
Twitter上的一些人要求我解释为什么USB3最终比USB2更难实现。答案超出了一条推文所能容纳的范围,所以我想我应该在这里给出一个简单但粗略的答案。这绝对不是全面的;把它当作一条更长的推文吧,这是一条什么样的推文,我有240多个字符,而且有喋喋不休的习惯。(我知道。)。 许多挑战来自我们绕过物理层限制的工作方式。......