科幻界面

2020-05-17 04:41:06

回到“银翼杀手”。我的意思是,大流行仍在肆虐,但也许当你在原地避难时,这会是一个很好的分散注意力的地方。因为你很聪明,尽可能躲在原地,而且没有注射消毒剂。而且,就像这部电影中的许多其他技术一样,这需要一段时间来解构、批判和重新想象。

在做他的侦探工作时,德卡从里昂的酒店房间里取回了一组快照,他把它们带回了家。上图中的一些东西吸引了他的眼球,他想要更详细地调查它。他拍摄了这张照片,并将其插入了他放在起居室里的一个黑色设备中。

注意:我将尝试在文本中描述此交互,但在查看之后更容易概念化。由于版权限制,我不能上传这个长度的视频和原始音频,所以我在下面添加了预先渲染的闭路字幕。剪辑中的所有对白都是戴卡德的。

他将快照插入一个水平狭缝中,然后打开机器。一条细长的水平橙色线条在前面板左侧发光。一系列看似随机长度的橙色线条开始在横跨面板其余部分的单行空间中相互追逐,并在Deckard使用它的整个过程中继续这样做。(想象一下,一个新闻报价器向后运行,其中的“标题”是闪耀的琥珀色线条。)。对于德卡来说,这似乎是无用的,绝对是毫无意义的分心,在他的外围视觉中加入了高对比度的运动,与下面真实的、有趣的内容争夺注意力。

一秒钟后,屏幕显示一个蓝色网格,在其后面显示快照扫描。他凝视着网格中的图像片刻,说出了一组指令,“将224增强到176。”

作为响应,三个数据点出现在屏幕底部的图像上。每个标签都有一个两个字母的标签和一个四位数的数字,例如。“ZM 0000 NS 0000 EW 0000。”NS和EW-大概分别是南北坐标和东西坐标-立即更新为“ZM0000 NS0197 EW 0334”。更新数字后,屏幕上会显示一个十字准线,指向网格中的单个矩形。

然后,随着ZM编号(可能是缩放或放大倍率)的增加,一个新的矩形将从边缘放大以匹配目标矩形。当动画矩形到达目标矩形时,其轮廓会闪烁几次黄色。然后在一系列步骤中放大矩形的内容以填满屏幕,这些步骤由类似于机械相机光圈的声音来点缀。扩大的问题已经完全解决了。覆盖将消失,直到下一组口头命令。从Deckard发出命令到设备显示最终放大图像之间的系统响应时间约为11秒。

在发出另一个命令之前,德卡德研究了一下新的图像。这一次,他说,“增强。”图像以类似的咔哒声放大,直到他告诉它,“停止。”

他给出的其他指示还包括“移入、拉出、向右跟踪、居中、向后、居中和向右平移”。其中一些包括离散的指令,如“Track 45 Right”,而另一些是相对命令,系统会遵守这些命令,直到系统被告知停止为止,如“Go Right”。

使用这样的命令,他分离出揭示重要线索的图像的一部分,然后他说出指令,“就在那里给我一份硬拷贝。”机器打印图像,Deckard用它来帮助找到照片中的复制者。

在批评之前,我想指出一点老练之处。Deckard可以发出带参数或不带参数的命令,检查员知道该怎么做。例如,“45号轨道向右”和“向右轨道”。如果没有该参数,它只会重复执行该操作,直到被告知停止为止。这有助于Deckard在他确切地知道他想要在哪里以及何时寻找时发出相同的基本命令,而不是确切地知道他在寻找什么。这是语言设计的一个很好的特点。

但尽管如此,让他用这种笨拙的方式提供循序渐进的指导,感觉就像是一些高科技的大通道(Big Trak)。(我试着找一个和这部电影一样古老的参考资料。)。这并不是所有的…。

我能回去提一下那个琥珀干扰灯吗?因为这会让人分心。而且毫无意义。我没有生气。我只是很失望。

在互动过程中的任何时候,如果屏幕上的任何数字都有意义,并且与德卡德说的数字有任何关系,那就太好了。例如,初始缩放(我在Photoshop中检查)约为304%,这既不是Deckard所说的224%,也不是176%。

可能每个方块都有一个数字,他只需以他想要的缩放范围命名两个方块,让机器找到范围,但是标签在哪里呢?他需要记住每个像素的地址吗?这是如何在任意缩放级别下工作的?

为什么在转换序列中会出现诱发癫痫的闪光?当然,我知道很多技术在受机械约束时会产生不幸的影响,但这是数字化的。

为什么打印的照片和他要硬拷贝的静止图像如此不同?

凝视着福特淡褐色眼睛里的倒影,很明显他在玩导弹司令部,而不是把注意力放在这个界面上。(好的,这是电影制作人的问题,不是界面的一部分,但还是要说出来。)。

因此,如果1982年雷德利·斯科特(Ridley Scott)在帖子中告诉我,我们不能重新拍摄哈里森·福特(Harrison Ford),我们必须利用现有的资源,这是我会做的,…。

挤压网格,使单元格与NTSC屏幕的4:3比例匹配。覆盖每个单元格的地址,同时突出显示边缘的列标识符和行标识符。让第一个单元格的轮廓在他说话时被照亮,并将轮廓展开以包含第二个命名的单元格。然后缩放,在过渡期间删除单元格标签。当处于全视图以外的任何位置时,在四个单元格中显示地图,在整体上下文中以可视方式显示缩放。

有了这个界面,现有对话的结构就更有意义了。当德卡德说,“把203号提升到608号”时,它会在镜子上放大,小地图会确认这一点。

数字不会匹配,但从最后的剪辑中很明显,斯科特并不关心这一点(或者,更仁慈的是,没有时间了)。不管怎样,我会在抗议下这样做,因为我会争辩说,这种交互需要在脚本中修复。

这项技术真正精妙之处在于它不仅仅是一张照片。仔细看这个场景,德卡不仅仅是在做CSI增强!命令(或者,不那么嘲弄地说,人工智能升级)。他正在使用照片检查器查看角落和从最小的反射中重建的对象。所以我们可以把这种互动想象成他在通过3D静物控制一架无人机,寻找线索来帮助他进一步破案。

要重新设计它,我们必须在基础层面上决定我们认为这是如何工作的,因为它将为显示器的外观着色。这就是从某个疯狂的3D摄像机捕捉到的所有数据,并在图像中可用吗?或者它是从二维图像的细节中推断出来的?让我们称第一个为3D捕获,第二个为3D推断。

如果我们确定这是一个3-D捕捉,那么他通过机器观察到的所有数据都具有相同的置信度。然而,如果我们认为这是一个3D推断器,比起相机直接捕捉的数据,德卡需要以更多的怀疑来对待推断的数据。3-D推断器是更困难的问题,它提出了一些我们在现代人工智能中必须处理的问题,所以可以这么说,这就是这种投机性技术的工作方式。

显示器应该做的第一件事就是清楚地显示观察到的内容和推断出的内容。如何做到这一点,部分是视觉设计和风格的问题,但部分是批评逻辑的问题。第一步是以照片逼真的方式渲染相机圆锥体中的所有内容,然后以一种表明其置信度的方式渲染相机截面体之外的所有内容。下面的比较说明了实现这一点的一种方法。

在比较中,德卡已经将“无人机”从右边看到的“实际照片”转向左边推断的空间。单色处理提供第一高置信度信号。

在场景中,主要的推论将来自阅读迪斯科舞会顶灯中的倒影,可能会增加网上可以找到的公寓平面图,或者可能是购买电器的收据,等等。它可以从倒影和高置信度来源重建的所有东西都有实心的黑线,一个二级信号。

较小的小摆设脱离了迪斯科球的反射,并从其他反射率较低的表面隐含出来,渲染时没有黑色线条和模糊。这提供了一个信号,表明该算法在其推断中具有非常低的置信度。

这只是处理它的一种方式(视觉上不是很有趣),但是应该说明,为了可信,照片检查器不应该在锥体之外有单一的渲染样式。它需要一些类似于这些水平的东西来帮助Deckard立即认识到他应该在多大程度上相信他所看到的。

现代CGI喜欢大体积投影。(例如,这是去年弗里茨获奖影片“蜘蛛侠:远离家乡”的中心新月。)。如果能看到德卡德在里昂的公寓里进行全息甲板般的重现,加上上面描述的所有视觉处理,那将是一次美妙的并列。

…。那会破坏现场的气氛。这不仅仅是关于德卡找到了线索,我们也看到了他是谁,他的生活是什么样子的。我们看到烟雾弥漫的公寓。我们看到单调的沙发。我们看到那堆旧的侦探机。我们看到霓虹灯和恼人的广告灯在他的窗户上来回摆动。让他沉浸在一个大的体积投影中会失去所有这些大气的东西,所以我建议要么像我们在“少数派报告”中看到的那样,让它保持一个小的包含副总统,要么就让它保持一个小的平板电视。

好了,现在我们已经了解了显示器的外观(和不应该),让我们继续讨论输入。

那么,要谈论投入,我们必须回到我最喜欢的一个话题上,那就是我们想要的交互的代理级别。简而言之,我们需要决定机器正在做多少工作。这台机器只是一个手动工具,德卡必须操纵它才能让它做任何事情吗?抑或是积极协助他呢?或者,最后,当他的注意力放在其他事情上时,它还能做这项工作吗?也就是说,它能代表他充当代理人吗?复杂的工具可以是这些模式的混合体,但是现在,让我们单独来看一下。

这就是“银翼杀手”中的照片检查器的工作方式。它可以做一些事情,但是德卡必须告诉它到底该做什么。但是我们仍然可以在这种模式下改进它。

我们可以给他很好的物理控制,就像这架概念型无人机的遥控器。飞行控制最终成为这个博客上反复出现的话题(甚至已经在Blade Runner对旋转器的评论中出现了),所以我可以继续讨论如何最好地做到这一点,但我认为手持控制器会破坏这个场景的感觉,就像Deckard坐下来玩视频游戏而不是做非工作时间的侦探工作一样。

类似地,我们可以讨论手势界面,使用我们以前在“攻壳机动队”中见过的一些提示性技术。但是再说一次,这会破坏现场的感觉,让他看起来更像约翰·安德顿(John Anderton)站在微型电视版的少数派报告著名的犯罪洗涤器前面。

赋予这一场景情感质感的一件事是,德卡一边做侦探作业,一边喝着一杯威士忌。这表明他的情绪有多低落。把它扔回去显然是他晚上例行公事的一部分,这在很大程度上是一种习惯,以至于他即使全神贯注于里昂的案子也会这样做。我们怎么能让他坐在沙发上,手放在铅水晶威士忌玻璃杯上,还在调查照片呢?他能用它来调查照片吗?

在这里,我推荐一些特别的有形用户界面。我第一次是在“星球大战”的假日特辑中使用这个超凡脱俗的东西,但我认为它在这里也能行得通。假设照片检查器上有一个高分辨率相机,界面允许Deckard将他想要的任何对象声明为控制对象。声明之后,摄影机根据曲面跟踪对象,使用对该对象的更改来控制虚拟摄影机。

在场景中,Deckard可以将威士忌玻璃杯声明为他的控制对象,并将他沙发的手臂声明为控制面。当然,他所处的虚拟空间比沙发臂要大,但它可以像鼠标和鼠标垫一样工作。他可以把它捡起来,然后再放回原处,以延长运动时间。

该方案考虑了除垂直升降之外的所有移动。这可以是一个手势或口头命令(见下文)。

使用此交互模型意味着Deckard可以使用威士忌玻璃杯,从而允许场景保持其纹理和手感。他还能喝酒,还能让他的侦探上台。

当Deckard不知道他要找的是什么时,间接操纵很有帮助。他可以环顾四周,走近一些东西来检查它们。但是当他知道他在找什么的时候,他就不应该去找了。他应该可以索要它,然后让照相检查员给他看。这需要我们假设一些人工智能。尽管“银翼杀手”显然包括通用人工智能,但让我们假设那种人工智能必须放在一个类似人类的复制体中,而不能挤到这个设备中。取而代之的是,让我们只扩展狭义人工智能的能力。

其中一些将是导航和特定的,例如,“缩放到背景中的镜子”,或者“重置方向”。有些会更抽象、更具体内容,例如。“去厨房”或“靠近那个红色的东西”。如果它有凝视探测功能,他甚至可以通过看它来指示位置。例如,“靠近那个红色的东西”,同时看着那个红色的东西。考虑到这个投机设备的3D推论性质,他可能还想追踪一个推论的出处,比如“我们怎么知道这把椅子在这里?”这意味着自然语言的生成和理解。

没有什么可以阻止他使用电影中听到的相同的通用命令,但我怀疑当他们有这样的命令和手头的对象控制器时,会不会有人想要使用这些命令。

理想情况下,Deckard也会有一些通用的搜索能力,用来提问和测试想法。“这些东西是在哪里买的?”或者随后,“有他购买的商店的录像带吗?”甚至,“在你看来那是什么样子?”(正确的答案应该是,“嗯,那看起来像是阿诺菲尼画像里的镜子,Ridley…。我是说…。Rick*“)它可以进行模式识别,并提供它有权访问的尽可能多的额外信息,就像Google Lens或IBM Watson图像识别所做的那样。

最后,他应该能够询问简单的事实,看看检查员是否知道或能找到它。例如,“场景中有多少人?”

所有这一切仍然需要Deckard发起行动,我们可以用一些代理思维来进一步增强它。

从代理的角度思考就是问,“系统可以为用户做什么,而不需要用户的关注?”(如果你想知道更多,我写了一本关于它的书。)。在这里,AI应该和Deckard一起工作。不只是建立推论和对观测进行分类,而且在整个场景中进行异常检测。其中一些将是毫无意义的,比如“要知道黄油刀是宜家的,而餐具的其余部分是克里斯托弗·拉格菲尔德(Christofle Lagerfeld)的。这里有些不对劲。“。不过,德卡会发现其中一些有用的。可能要由Deckard来审查总结,并决定哪些值得进一步调查。

它也应该能够帮助他实现他的目标。例如,警方已将佐拉的照片存档。(她的肖像甚至在我们一开始看到的档案中旋转,所以它知道她在3D中的样子,以便进行非常复杂的模式匹配。)。当特工在逆射线跟踪场景并重建推断的空间时,一旦检测到任何面孔,它就应该检查头号通缉犯名单,特别是德卡德的案件文件。它不应该等他找到它。这再次给剧本带来了一些挑战。当技术人员可以而且应该在看到图像几秒钟后找到Zhora时,我们如何留住英雄Deckard?这对作家来说是一个新的挑战,但对于可信度来说,这变得越来越重要。

德卡德从里昂的公寓里拿出一瓶威士忌、一只玻璃杯和那张照片。他坐在沙发上,把照片放在咖啡桌上,说“照片检查员?”放在一张杂乱的茶几上的机器恢复了活力。德卡继续说,“让我们看看这个。”他指着那张照片。一条细长的光线扫过图像。扫描的图像出现在屏幕上,从边缘拉近一点。标签上写着“延伸场景”,我们看到框架外的公寓的线框表示开始成形。一小部分异常情况开始出现在左侧。德卡往杯子里倒了几指威士忌。他喝了一杯,说,“控制员,”然后把杯子放在沙发扶手上。面向检查器的手臂上会出现小的投影图形。他说,“好的。有人躲起来了吗?搬家?“。检查员回答说:“不是,也不是。”德卡德看着屏幕说,“放大到那只手臂,然后钉在脸上。”他逆时针转动沙发扶手上的玻璃,“无人机”围绕着里昂的脸旋转,模糊的部分用蓝色渲染。他问道:“你有什么信心?”检查员回答说,“95。”在屏幕的一侧,督察覆盖了里昂的警察个人资料。德卡德说,“解开”,然后举起酒杯喝了一杯。他从沙发走到地板上,更专注地凝视着,然后把饮料放在咖啡桌上。“新的表面,”他说,然后顺时针转动玻璃杯。摄像机转过来,他看到了一间卧室。“我们怎么会有这么大的推论呢?”他问。检查员回答说:“大厅里的凸面镜子…”。德卡打断了他的话,说:“等一下。那是一只脚吗?你说过没有人躲起来。“。检查员回答说:“这个人没有躲藏。他们似乎在睡觉。“。德卡德翻了翻他的眼睛。他说,“放大到脸和别针。”视图放大到脸部,但相机与她的下巴水平,因此很难辨认出脸部。德卡德将玻璃向前倾斜,相机升起,聚焦在一张蓝色的线框面孔上。迪卡德说,“你觉得那像是佐拉吗?”督察盖上了她的警方档案,回答说,“63%的人是这样做的。”迪卡德说,“你为什么不早说呢?”检查员回答说:“我的门槛设为66%。”德卡说,“马上给我一份硬拷贝。”他举起酒杯,喝完了酒。

这一场景保持了原作的质地和基调,并扎营在狭隘AI的局限性上,让德卡成为英雄。也没有让他设计一个虚拟的大陷阱。

获得最佳接口提名的电影应对了一项非同寻常的挑战,即要做到可信,并帮助描绘出故事世界的图景。他们在用投机技术讲故事方面达到了最先进的水平。最佳叙事提名分别是“我是母亲”、“蜘蛛侠:远离家园”和“黑衣人:国际版”。

在来自MCU的第二部2019年提名电影中,彼得。

..