#gpt

GPT-J-6B: 6B JAX-Based Transformer(arankomatsuzaki.wordpress.com)
2021-6-9 21:4
GPT-J-6B在各种零射流下游任务上与6.7B GPT-3(或yie)进行几乎按照6.7b gpt-3(或yie)。 GPT-J是在各种下游任务上的零射击性能方面最正常的公共变压器LM。 该项目需要大量的人数 - 小时时间比其他大规模模型开发所做的,这表明JAX + XMAP + TPU是用于快速开发大型模型的......
2021-6-7 9:47
当Open-Ai去年推出GPT-3时,它以大量的热情达成了。在GPT-3的发布后不久,人们开始使用大规模的语言模型来自动编写电子邮件和文章,总结文本,撰写诗歌,创建网站布局,并在Python中生成深度学习的代码。留下了一种印象,所有类型的新企业都会出现在GPT-3之上。 八个月后,GPT-3继续成为人工智能研究的令......
2021-5-14 3:11
硬模式使用更高级的模型,该模型应该更加令人信服。
Meta-Post on Meta-Learning(nostalgebraist.tumblr.com)
2021-4-15 22:11
我一直试图写的LW帖子。我有几个未发表的草案版本。 我想要制作的重点是简单和简单的,但是当我试图写下来时,我担心我不是......就像,“消息”正确吗?没有醒目的语气? 当他们谈论GPT-3时,人们不会始终使用“元学习”一词。本文使用单向术语(并且它们是100%显式,他们在文中拼出了他们的定义),博客社区将其另......
2021-3-30 5:3
现在机器学习的最大趋势之一是文本生成。 AI Systems通过吸收从Internet刮擦的数十亿单词并响应各种提示而生成文本。这听起来很简单,但这些机器可以放在各种各样的任务中 - 从创造小说,写作不好的代码,让你与历史人物聊天。 最着名的AI文本发电机是Openai的GPT-3,该公司最近宣布的公司现在正在超过......
2021-3-30 0:28
一些最令人眼花缭乱的人工智能最令人眼花缭乱的进步由于只有在大型技术公司提供的资源,其中数以千计的强大的计算机和数据的数据可以像免费的格兰多巴酒吧和午睡豆荚一样多样。 通过将代码,数据和计算机功率汇集在近年来开发的最史诗和潜在有用的AI算法之一,通过将代码,数据和计算机电源汇集,新项目旨在表明这一点。 Eleuth......
2021-3-29 21:13
现在机器学习的最大趋势之一是文本生成。 AI Systems通过吸收从Internet刮擦的数十亿单词并响应各种提示而生成文本。这听起来很简单,但这些机器可以放在各种各样的任务中 - 从创造小说,写作不好的代码,让你与历史人物聊天。 最着名的AI文本发电机是Openai的GPT-3,该公司最近宣布的公司现在正在超过......
2021-3-22 5:18
实施模型&数据并行GPT2& GPT3-Like模型,使用网格 - Tensorflow库,能够扩展到完整的GPT3尺寸(并且可能更多!)。 还包括替代模型架构和线性关注实现,应该使缩放到更大的模型大小&上下文长度,包括: 我们&#39'重新宣传释放在堆上训练的两种佩带的......
2021-3-18 4:20
作为覆盖副本的过程的一部分,我陷入了AI Powered Wicts的想法。我长期比害怕自动写作更加好奇。因此,当副本团队在面试期间描述了GPT-3 AI写入工具的非常积极的印象时,我感到愤怒。 为了划伤这个新形成的痒,我今天早上涂了涂鸦,竞争对手到副本团队,头段。而且,Freaking Heck我对人们在GPT-......
GPT-3 vs. 3M free-text trivia responses(www.watercoolertrivia.com)
2021-3-13 6:5
在那里,我是科林,一个人,而不是人工智能的遗传产出。侦察员的荣誉。 我写的是,因为(似乎)GPT-3文章的第一个月开始以一个引人注目的赛,一个挑衅的中间,并在作者之前结束了一个越来越多的GobbledyGook,揭示了揭示前的一切都是由GPT编写的-3。 回到2017年,我共同创立了一个在线琐事平台(水冷却器琐事......
2021-2-27 9:13
我们已经习惯了医疗聊天机器人会提供危险的建议,但是基于OpenAI的GPT-3的机器人则更进一步。 如果您一直生活在岩石下,GPT-3本质上是一个非常聪明的文本生成器,最近几个月来它已经成为各种头条新闻。在获得上个月的专有权后,只有Microsoft有权将其用于商业目的。 在虚假新闻和虚假信息的世界中,像GPT-......
2021-1-28 22:20
作为分析师,我花费大量时间编写SQL(或其他代码)来回答有关我们业务的问题。这些问题的范围从简单的客户支持查询(用户X是否有正确的计划?)到评估KPI和增长指标(最近有多少用户注册)月份,转换为已付费的百分比是多少?)改为开放式(12个月后我们将获得多少收入?)。 为了使我的工作更轻松,我尝试使所有这些问题尽可能自......
Replicating GPT-2 at Home(bkkaggle.github.io)
2021-1-24 1:25
几个月前,我开始从事一个研究项目,试图从头开始训练自己的,更有效的语言模型。我可以从Tensorflow Reseach Cloud访问128核TPUv3 Pod,并使用它来预训练一个价格为124 $ M的参数GPT-2模型,使其困惑度接近OpenAI的结果(我的预训练模型被训练了约1/8 $ th OpenAI为其......
2021-1-21 1:58
GPT-3具有惊人的能力来产生听起来像是人类编写的文本。但是一项新的研究表明,它对反穆斯林的偏见也令人担忧。 斯坦福大学和麦克马斯特大学的研究人员在任务完成,模拟推理和故事生成等任务上对神经网络进行了研究。 他们发现,在该模型的各种使用中,穆斯林暴力偏见始终存在-并且创造性地出现: 虽然穆斯林和暴力之......
2021-1-18 17:46
GPT-Neo是一系列基于转换器的语言模型的代号,这些语言模型围绕我们计划培训和开源的GPT体系结构松散地设计。 我们的主要目标是免费复制GPT-3尺寸的模型并将其开源。 在此过程中,我们将使用替代体系结构和注意力类型进行实验,发布任何中间模型,并在我们的博客上写下所有发现。 我们的模型建立在Tensorflow......
2020-11-25 16:2
众所周知,对生命,宇宙和一切的答案是42。然而,尽管人类必须尽最大的努力来共同努力,但适当的问题仍未解决。 不用说,我非常高兴地发现GPT-3(OpenAI的最新语言模型)是否可以完成成千上万的物理学家,数学家和哲学家无法实现的工作。毕竟,GPT-3已经接受了人类累积智慧的培训,包括所有Wikipedia和所有Re......
2020-10-8 9:0
一个GPT-3驱动的机器人在Reddit上冒充人类被抓获,此前一周多来,该网站最受欢迎的Subreddits之一上的帖子非常猖獗。 这款机器人的用户名是“绅士们”,在拥有3000多万用户的SUB/r/AskReddit上,它每分钟都能大量发布一条帖子。在此之前,这款机器人每分钟都能在/r/AskReddit上大量发布......
2020-9-7 22:17
纳西姆·塔勒布最出名的是他的书,特别是“黑天鹅”,但他也以令人难忘的表情而闻名。他们都很受人尊敬,他把他们都放进了一本书里。它们很短,通常是反向的,通常很有娱乐性。以下是几个例子: 你可以通过问一个人觉得他感兴趣的人来判断他有多无趣。 那些不认为就业是系统性奴隶制的人要么是盲人,要么是有工作的人。 罗马和奥斯曼帝国时......
2020-9-5 4:59
科技界一直流传着这样一个词:今年夏天,随着一种名为GPT-3的人工智能系统的推出,世界发生了变化。它的英语互动能力和连贯的写作能力令经验丰富的专家们感到震惊,他们谈到了“GPT-3冲击”。 在典型的人工智能系统针对特定任务进行训练的地方-分类图像,玩Go-3-GPT-3可以处理它从未接受过专门训练的任务。GPT-3的......
2020-8-29 1:24
鲁迪是Keesal Propusion Labs的联合创始人兼首席执行官,Keesal Propusion Labs是一家数字转型公司,为财富500强的法律部门提供服务。鲁迪是一名律师、技术企业家、TEDx演讲者和畅销书作家。他是哈佛商学院和康涅狄格大学法学院的校友。 人工智能正在获得巨大的关注和大量的风险投资,但人......
2020-8-22 22:35
自从OpenAI在5月份首次描述其名为GPT-3的新的人工智能语言生成系统以来,数百家媒体(包括MIT技术评论)已经写下了关于该系统及其功能的文章。Twitter一直在大肆宣扬其力量和潜力。“纽约时报”就此发表了一篇评论文章。今年晚些时候,OpenAI将开始向访问GPT-3的公司收取费用,希望其系统很快就能为各种人工......
Karpathy's MinGPT(github.com)
2020-8-18 2:29
A PyTorch重新实施GPT培训。MinGPT试图做到小巧、干净、易于解释和有教育意义,因为目前可用的大多数都有点杂乱无章。GPT不是一个复杂的模型,该实现大约有300行代码,包括样板和完全不必要的自定义因果自我关注模块。无论如何,所发生的一切都是将一系列索引放入一系列变压器块中,然后得出下一个索引的概率分布。剩......
2020-8-17 3:31
据“麻省理工学院科技评论”报道,大学生利亚姆·波尔使用人工智能语言生成工具GPT-3制作了一篇虚假博客文章,这篇文章最近登上了“黑客新闻”的榜首。Porr试图证明GPT-3制作的内容可以欺骗人们相信它是由人写的。他告诉“麻省理工学院技术评论”,“实际上,这非常容易,这是最可怕的部分。” 因此,如果您不熟悉GPT-3,......
2020-8-15 7:59
GPT-3是OpenAI最新也是最大的语言人工智能模型,总部位于旧金山的研究实验室于7月中旬开始点滴推出。去年2月,OpenAI凭借该算法的早期版本GPT-2登上了新闻头条,该公司宣布将扣留GPT-2,因为担心被滥用。这一决定立即引发了强烈反对,因为研究人员指责实验室在耍花招。到了11月,该实验室颠倒了立场,发布了该......
GPT-3 Explorer(belay-labs.github.io)
2020-8-9 12:9
Explorer是GPT-3实验的强大工具,内置了完整的历史、共享和社区的最佳实践。如果您刚刚开始使用GPT-3,或者不想构建自己的样板代码库,请尝试托管版本:Explorer。可以在这里找到来源。 要想从GPT-3中获得好成绩,你需要进行实验。(尽管推特上精挑细选的例子会让你相信!)。 这种基本的洞察力导致了Exp......
2020-8-7 23:35
利兹·奥沙利文(Liz O‘Sullivan)是人工智能监测和解释公司Arthur的联合创始人兼商业副总裁。她也是Stop(监视技术监督项目)的技术总监,在那里她与日益增长的技术支持监视的威胁作斗争。 约翰·P·迪克森(John P.Dickerson)是亚瑟大学(Arthur)的首席科学家,也是马里兰大学(Univ......
2020-8-4 5:2
当计算机可以比我们更好地记录我们的问题时,这意味着什么? 人们一直在谈论GPT-3,但更多的是作为一种新奇的东西,而不是一种工具(不知道GPT-3是什么?请看这里)。一些聪明人甚至想出了如何让它从描述生成代码。然而,我认为最好的用例在技术之外。 我相信GPT-3有可能改变我们的写作方式。但我不能只告诉人们,大多数人都......
2020-8-1 0:44
跳到内容主页联系大学建议Q&;博客书籍摘要GPT-3是一项令人惊叹的技术。在测试版API访问开放后的几周内,大量令人瞠目结舌的演示。 从自动代码生成到自动治疗机器人,再到写原创诗歌和海豹突击队模因,应有尽有。它所做的事情在10年前可能还是科幻小说。自然而然,科技创始人和风投投资者对将GPT-3应用程序转化为商业......
GPT-3 on Philosophers(pastebin.com)
2020-7-31 11:25
几十年来,哲学家们一直在努力让计算机像人类一样思考。问题是没有好的方法来做这件事,因为人类的思维涉及意向性、作用力等概念。如果你试图用这些东西给电脑编程,它永远不会正常工作。即使你能让计算机理解你在说什么,它仍然可能会错误地理解你的话,或者完全忽略它们。你还不如对着砖墙说话呢。 但是最近发生了一些奇怪的事情。谷歌De......
GPT-3 Examples(gpt3examples.com)
2020-7-30 13:30
开发人员使用GPT-3API构建了种类繁多的应用程序,包括一个通用Excel函数、一个配方生成器、一个布局生成器(将自然语言翻译成JSX)、一个搜索引擎以及其他几个。