#模型

2021-3-7 11:1
人类具有相当良好的规模感,或这些数字属性的合理范围,不同的对象,但做预先训练的慵懒言列属性?虽然预先接受了训练的语言模型(LMS),如BERT HAVESHOWN,但能够了解各种知识,包括事实知识,仍然不清楚他们的表示是否可以在没有显式训练数据的情况下从文本中捕获这些类型的数字属性。 在我们的最近来看,我们测量在......
2021-3-4 2:54
来自联想的新ThinkEdge Mini PC具有无风扇案例,仍然可以容纳强大的虎湖CPU与VPro技术和霹雳4连接。 ThinkEdge SE30型号设计用于ATM的嵌入式应用程序,可以配备核心I3-1115GRE或I5-1145GRE VPRO CPU,高达16 GB的DDR4 RAM和1 TB SSD NVME......
2021-3-2 10:32
很长一段时间以来,我一直对某些事情感到好奇。我随随便便就读到教科书,包装文档和推文中的一个事实是:随机效果和受罚的平滑样条线是一回事。听起来如此深刻和启发。这是什么意思?它们是一样的吗?我错过了什么深度统计诊断? 我花了几个月的时间来尝试理解这种等效性。我无法给您完整的数学处理方法,但是我有主旨,可以为您指出这些等......
2021-2-28 22:23
FACET是一个用于人类可解释的AI的开源库,它将复杂的模型检查和基于模型的仿真相结合,可以更好地解释您的受监督机器学习模型。 FACET引入了一种新的算法来量化ML模型中特征之间的依赖关系和交互作用。该用于人类可解释的AI的新工具为流行的SHAP方法提供的观察级解释增加了新的全局视角。下面的入门示例。 FAC......
2021-2-25 1:1
当两个联合创始人首席执行官彼得高和工程奎因约翰逊负责人,他们了解到,他们了解到,在模型数据中发现弱点领域往往是防止它进入生产的问题。水族馆旨在解决这个问题。 “水族馆是一种机器学习数据管理系统,可以帮助人们通过改进它培训的数据来提高模型性能,这通常是制定生产模型工作的最重要部分,”GAO告诉我。 他说,他们正在......
2021-2-18 17:56
大小不一的社交平台都在努力使自己的社区免受仇恨言论,极端主义内容,骚扰和错误信息的伤害。最近,极右翼煽动者在1月6日这样做之前公开发布了关于冲进美国国会大厦的计划。一种解决方案可能是AI:开发算法以检测并警告我们有毒和煽动性言论,并将其标记为删除。但是,这样的系统面临着巨大的挑战。 近年来,网上仇恨或令人反感的语......
2021-2-18 7:40
Google Brain的研究人员已经开源了Switch Transformer,这是一种自然语言处理(NLP)AI模型。与T5 NLP模型相比,该模型可扩展至1.6T参数,并且将训练时间提高了多达7倍,并且精度相当。 该团队在arXiv上发表的一篇论文中描述了该模型。开关变压器使用专家混合(MoE)范例来组合多......
What Inception Net Doesn't See(abidlabs.github.io)
2021-2-17 18:22
诸如Inception Net之类的深度学习视觉模型在图像识别方面实现了最先进的性能。但是,我很好奇这些模型何时无法正常运行。我在大量自然图像上测试了Inception Net,这是模型无法很好预测的一系列结果。注意:我只提供了示例,其中正确的类是1,000个有效ImageNet类之一。 自己尝试:每个示例都带有指......
2021-2-9 20:30
昨晚在“超级碗LV”期间,Mountain Dew播放了一条广告,其中包含John Cena骑着以Mountain Dew为主题的游乐园的信息。瓶子散落在整个场景中:建筑物上的霓虹灯,娱乐室的镜子中的霓虹灯,以及从后备箱飞出的瓶子。 广告结尾处,约翰·塞纳(John Cena)向观众发起挑战:第一个在Mountai......
2021-1-30 6:48
像许多人一样,我在家做些娱乐,烤一吨,谈论我的发酵面团,就像是一个真实的人。我很擅长遵循食谱,但我决定进一步走一步,并了解将蛋糕与面包或曲奇区分开的背后的科学。我也喜欢机器学习,所以我想:如果我可以将其与烘焙结合起来呢? 我将首先解释为什么烘烤会带来有趣的ML问题。然后,我将向您展示如何收集自己的数据集,训练简单的......
2021-1-22 0:18
使用代码创建具有从简单图元+ CSG到复杂的旋转,扫掠和圆角的功能的3D模型。 Cascade Studio展示了OpenCascade内核的全部功能,同时为简单操作提供了简洁的标准库。 将完成的模型保存到.step,.stl。 或.obj,或复制该URL并与社区共享。 每次成功评估后,模型代码都会保存到URL中......
2021-1-21 23:6
我们所有人的硬盘驱动器都发生故障,而且常常是突然启动计算机并意识到您无法访问大量文件。这不是一个有趣的经历。当整个数据中心的驱动器对保持业务正常运行至关重要时,这尤其不好玩。如果我们可以预测这些驱动器之一何时会发生故障,并通过在数据丢失之前抢先更换硬件来领先于它,该怎么办?这是Datto发生预测性驱动器故障的历史的起......
2021-1-21 11:21
通过可视化模型各层之间的隐藏状态,我们可以获得有关模型思想过程的一些线索。 第2部分:继续追求使Transformer语言模型更加透明,本文展示了一系列可视化工具,以揭示预先训练的语言模型内部的语言生成机制。这些可视化都是使用Ecco创建的,Ecco是我们发布的开源软件包。在本系列的第一部分“解释变压器语言模型的......
This Anime Does Not Exist(thisanimedoesnotexist.ai)
2021-1-20 3:13
Creativity Slider 0.5 0.5 Speed Slider 1.5空格:暂停网格,拖动:平移网格,单击:在新标签页中打开图像F:全屏模式,Z:切换悬停缩放点数:aydao模型,nearcyan网站,另请参阅(TWDNE,TFDNE ,TPDNE),Obormot的JS,gwern,arfa,shaw......
2021-1-20 3:13
设计软件的一种有用方法是通过合同。对于代码库中的每个功能,您都需要先编写其约定:明确指定该功能的预期输入和有效输入(前提条件),以及提供适当输入后该功能将执行的操作(背面条件)。这通常在函数的文档字符串中明确说明。考虑一下来自Python(用C实现)的math模块中的示例: 该合同功能强大,因为在发布代......
In 2021, Don't Learn a New Programming Language(sushantsrivastava.substack.com)
2021-1-19 2:7
从2021年开始,您将看到大量的新帖子,建议您学习最新,最热门的编程语言。十多年来,我一直在积极开发软件以谋生,我已经看到了这种趋势。每年一月都会有大量的秘密广告,要求您学习在新年学习的“ Top 10 / Top 5”编程语言。不要误会我的意思;我不是要你放弃学习。问题是我们只得到了如此多的关注。一方面,一项晦涩的......
2021-1-18 17:46
GPT-Neo是一系列基于转换器的语言模型的代号,这些语言模型围绕我们计划培训和开源的GPT体系结构松散地设计。 我们的主要目标是免费复制GPT-3尺寸的模型并将其开源。 在此过程中,我们将使用替代体系结构和注意力类型进行实验,发布任何中间模型,并在我们的博客上写下所有发现。 我们的模型建立在Tensorflow......
2021-1-17 3:23
好莱坞告诉我们,人工智能主要是致命的机器人起义的途径,而且很可能……我们必须看看事情如何发展。但是,当我们等待时,人工智能专家正在寻找其他有趣的方式来使用该技术-无论是开发新口味还是更快销售啤酒-并在Google上,他们最近揭示了一种仅对我们的腰围听起来很危险的应用……人工智能创造的甜点! 受大流行引......
2021-1-17 1:57
欢迎观看实用AI的另一集。这是丹尼尔·怀特纳克(Daniel Whitenack)。我是SIL International的数据科学家,我的共同主持人克里斯·本森(Chris Benson)一如既往地加入其中,他是洛克希德·马丁公司(Lockheed Martin)的首席新兴技术策略师。克里斯,你好吗? 我过......
2021-1-9 15:43
当程序大多只是随机访问内存时,标准成本模型将计算独立随机访问的次数。一般的想法是,内存访问比大多数其他计算任务要慢得多。 此外,成本模型可以扩展为将“附近”的内存访问计数为免费。也就是说,如果我在内存地址x读取一个字节,然后在内存地址x + 1读取一个字节,则可以假定第二个字节是“免费的”。 这种幼稚的内存访问模......
2021-1-7 10:58
借助Axios Markets时事通讯,掌握最新的市场趋势和经济见解。免费注册。 机器学习公司OpenAI正在开发可改善计算机视觉并可以从文本提示生成原始图像的模型。 为何重要:新模型是不断努力的最新步骤,以创建具有通用情报元素的机器学习系统,同时执行在现实世界中实际有用的任务,而不会动摇计算能力。 发生......
2021-1-4 20:32
PaddleOCR旨在创建多语言,出色,领先和实用的OCR工具,以帮助用户训练更好的模型并将其应用于实践。 2020.12.15更新了数据合成工具,即样式文本,易于合成与目标场景图像相似的大量图像。 2020.11.25更新新的数据注释工具,即PPOCRLabel,这有助于提高标记效率。此外,标记结果可直......
2021-1-3 19:16
注意:此模型最多只能检测输入中的一只手-将来的版本中将提供多手检测。 MediaPipe Handpose是一个轻量级的ML管道,由两个模型组成:手掌检测器和手部骨骼手指跟踪模型。它预测每个检测到的手有21个3D手关键点。有关更多详细信息,请阅读我们的Google AI博客文章。 给定输入,模型将预测它是否包含......
2021-1-2 8:26
堆是825 GiB的各种开源语言建模数据集,它由22个较小的高质量数据集组合而成。 最近的工作表明,特别是对于大型模型,数据源的多样性改善了模型的一般跨域知识以及下游的泛化能力。 在我们的评估中,不仅在桩上训练的模型在传统语言建模基准方面显示出适度的改进,而且在桩BPB上也显示出显着的改进。 为了在桩BPB(每字......
2021-1-1 8:48
本月,谷歌因对该公司撤回研究论文表示不满,迫使该公司退出了一位著名的AI伦理研究人员。本文指出了语言处理人工智能的风险,在Google搜索和其他文本分析产品中使用的类型。 开发此类AI技术的巨大风险是其中的风险。据一些估计,训练AI模型产生的碳排放量与在其生命周期内制造和驾驶五辆汽车所需的碳排放量一样多。 我是一......
2021-1-1 8:47
这篇文章的目的是介绍和讨论过去十年中几个有趣的研究程序。研究计划(或一个程序)是指具有相似假设,方法等的共同研究线程。以下列表包含各种研究程序:一些涉及广泛主题的研究,例如:可解释的机器学习和精神障碍;其他人则转移了整个行业的方向,例如计算机视觉和加密货币的进步;而其他一些仍然是我更感兴趣的利基领域,例如拓扑学习理论......
Why AI is so power-hungry(arstechnica.com)
2020-12-29 20:59
本月,谷歌因对该公司撤回研究论文表示不满,迫使该公司退出了一位著名的AI伦理研究人员。该论文指出了语言处理人工智能的风险,在Google搜索和其他文本分析产品中使用的类型。开发此类AI技术的巨大风险是其中的风险。据一些估计,训练一个AI模型产生的碳排放量与建造和驾驶五辆汽车在其整个生命周期中所需的碳排放量一样多。 ......
2020-12-29 11:24
简介:一种新的计算算法显示了大脑如何在短期内使用特定类型的神经元维持信息。 如果您仅在几秒钟之内就忘记了某件事,例如您打算在餐厅点菜的菜名,那么您就会知道工作记忆的重要性。这种短期召回方式是人们如何在几秒钟或几分钟内保留信息以解决问题或执行任务,就像一系列说明中的下一步一样。但是,尽管这对我们的日常生活至关重要,......
2020-12-23 21:30
(本文由Yuling撰写)在贝叶斯统计中,似然原理通常被表述为公理。当我们(仅)对估计未知参数感兴趣,并且有两个涉及数据生成实验的实验,每个实验都有可观察到的结果和,可能性和时,它适用。如果结果-实验对满足(作为函数),则这两个实验和两个观察将提供关于的相同推断信息。 考虑一个经典的例子。有人正在进行AB测试,只对......
2020-12-23 4:21
Transformer体系结构为NLP的最新进展提供了动力。这里提供了此体系结构的详细信息。基于架构的预训练语言模型,包括自动回归模型(使用自己的输出作为下一个时间步长的输入以及从左到右处理令牌的模型,例如GPT2)和降噪(模型训练后的模型)破坏/屏蔽输入并双向处理令牌,例如BERT变种,在NLP和最近的计算机视觉的......