简单图像矢量化

2020-11-01 14:07:53

矢量化是指当你拍摄一些“我的世界”风格的光栅图像，并从中制作一张清晰的矢量图片的时候。

当你想把卫星照片变成地图时，它特别有用。或者，如果您想扫描一些蓝图并将其转换为CAD模型。或者，如果您想重新发布一个旧游戏，但您不想从头开始重新绘制所有的艺术作品。

我要告诉你的算法与所有这些事情没有任何关系。它是一种基本的矢量化技术，在最初的形式下，在行业中几乎没有应用。

从好的方面来说，它很好地说明了这种方法。它展示了双线性插值、梯度下降和参数样条线如何协同工作来解决真实世界的问题。至少，它让学习所有这些东西变得更有说服力了。

光栅图像本质上是一张由物体组成的矩形桌子。如果它是全彩色RGB，那么它就是彩色像素表。颜色像素是8位整数值的三元组，其中每个值表示红色、绿色和蓝色的量。

诸如从计算机断层扫描获得的医学图像通常是12位或16位整数的表格。它不是真正的颜色，因为这些值来自不可见的X射线辐射，但它们被称为灰度值。

卫星图像可能有很多频道。除了可见幽灵的颜色外，它们还可能含有紫外线和红外线的光度。通道可以用整数或浮点值表示。

从技术上讲，我们已经可以相当容易地将其转化为矢量。让我们就某个阈值达成一致，并标记所有值超过该阈值的像素的轮廓。

嗯，这很简单，但这不是我们想要的。我们要的是曲线，而不是拐角。为此，我们必须让我们的形象不那么拐弯抹角。

让我们假设我们的形象不是一张价值表。让我们假设我们只知道像素中心的值，我们必须以某种方式猜测它们之间的值。

这称为插值。最简单的情况是最近邻插值法，对于图像上的每个点，该值都是最近像素中心的值。但这只会把它变回一张桌子。

更先进一点的是双线性插值。该值是四个邻接值的线性和。看起来是这样的。

//带越界检查的像素值函数Pixel_in(象素，i，j){if(i&>；=Pixels.length)返回Pixel_in(象素，Pixels.length-1，j)；if(i<；0)返回Pixel_in(象素，0，j)；IF(j&>；=象素[0].length)返回Pixel_in(象素，i，象素[0].length-1)；IF(j<；0)返回Pixel_in(象素，i，0)；返回象素[i][j]；}//线性插值函数value_in(像素，x，y){var j=Math.Floor(x-0.5)；var tj=x-0.5-j；var i=Math.Floor(y-0.5)；var ti=y-0.5-i；返回Pixel_in(像素，i，j)*(1-ti)*(1-tj)+Pixel_in(像素，i，j+1)*(1-ti)*(Tj)+Pixel_in(像素，i+1，j+1)*(Ti)*(Tj)+Pixel_in(像素，i+1，j)*(Ti)*(Ti)*(1-Tj)；}。

如果我们把插值值达到阈值的像素变暗，我们就会得到某种轮廓。

还有其他方法。很多。但是线性插值很好地解决了拐角边界问题。尽管如此，我们看到的边界仅仅是某个门槛的边界。它还不是矢量表示法。

我们可以借鉴最简单的平滑等高线算法的思想。我们将从源像素建立一个初始边界，然后我们将使用线性插值图像来找到放置每个轮廓点的最佳位置，这样图像值将达到阈值。

当你有一个距离场时，这就很容易了。距离场是指对于空间中的任意点，您可以判断它离所需曲面的距离有多远。它基本上是一个从空间点到距离的函数。

你取它的梯度，取你的值和阈值之间的差值。因为它是距离字段，所以值差异正好是您应该移动点的距离。而梯度是完全相反的方向。你只需求逆、乘、加 - ，你就在那里了。

不幸的是，我们没有距离场。我们有一个连续的图像，它只与一个相似。

但这一原则仍然有效。如果您逆着渐变进行遍历，则会更接近阈值。差异越大，你就必须走得越远。只是你不会总是一次尝试就能做到。

//梯度函数梯度(像素，x，y){const EPS=1e-5；return[(value_in(像素，x+EPS，y)-value_in(像素，x，y))/EPS，(value_in(像素，x，y+EPS)-value_in(像素，x，y))/EPS]；}//如果value_in是距离函数GRADER_SHIFT(像素，阈值，x，y){var g=GRADER(像素，x，y)；var g_Norm=Math.sqrt(g[0]*g[0]+g[1]*g[1])；var d=Threshold-Value_in(像素，x，y)；返回[g[0]*d/g_NORM/g_NOROM，g[1]*d/g_NORM/g_NORM]；//如果value_in是距离函数，则返回[g[0]*d/g_NORM/g_NORM，g[1]*d/g_NORM/g_NORM]；}//使一个点更接近阈值隔离函数fit_point_Better(像素，阈值，点){const ok_error=1/255；if(Math.abs(value_in(像素，点[0]，点[1])-阈值)<；ok_error)返回点；gs=GRADER_SHIFT(像素，阈值，点[0]，点[1])var new_point=[point[0]+gs[0]，point[1]+gs[1]]；返回FIT_POINT_BETER(像素，阈值，NEW_POINT)；}。

我们将根据渐变移动轮廓点，直到我们足够接近阈值。

要使轮廓线光滑，只需将每条直线段变成一条参数三次曲线即可。

这听起来可能比实际情况复杂得多。一条参数三次曲线就是一对多项式。如果在这些点上有点和偏导数，就可以从这对线性系统中获得它们的系数：

Px(T1)'；=3aXt12+2bxt1+c=dx1/dtpx(T1)=axt13+bxt12+cxt1+d=x1px(T2)=axt23+bxt22+cxt2+d=x2px(T2)'；=3axt2+2bxt2+c=dx2/dtPy(T1)'；=3a yt 1 2+2b yt 1+c=dy 1/dt Py(T 1)=a yt 13+b yt 12+c yt 1+d=y 1 Py(T 2)=a yt 23+b yt 22+c+d=y 2 Py(T 2)'；=3a yt 22+2b yt 2+c=dy 2/dt。

更重要的是，由于我们可以选择参数范围，因此可以将其设置为[0..1]。这极大地简化了我们的系统，使其非常容易解决。

下面是从两对点和切值生成一个多项式系数数组的函数。

//特定于[0..1]参数化样条函数SPLINE_FOR(p1，p1d，p2，p2d){//A=[//[1，0，0，0]，//[0，1，0，0]，//[1，1，1，1]，//[0，1，2，3]]；//B=[p1，p1d，p2，p2d]return[p1，p1d，3*p2-p2d-3*p1-2*p1d，p2d+p1d-2*p2+2*p1]；}。

//多项式函数多项式_in_t(A，t){var pt=0.0；for(var i=0；i<；A.length；++i){pt+=A[i]*Math.pow(x，i)；}返回pt；}。

所以对于每条有切线的线段，我们可以做一个参数多项式。不过，有一个问题。我们没有切线。

我们有梯度，它与切线正交，但每个点都有两条可能的切线。切线可以从渐变向左或向右。

但这是可以解决的。让我们选择我们喜欢的方向，并保持一致。

让最初来自水平方向线段的曲线始终具有DX>；0的两条切线。而那些来自垂直方向的线段，将具有dy>；0。

让我们把向量化分成两部分。首先，我们将从像素中获取每个线段的点和切线。然后我们将把它全部变成多项式样条。

函数Turn_Pixels_Into_Points_and_Tangents(像素，阈值){var Points=[]；var Tangents=[]；//"；水平"；块(var i=0；i<；=Pixels.length；i+=1){var old_point=[]；var old_Tangent=[]；for(var j=0；j<；=像素[0].length；J+=1){//如果右、左、上、下四个像素有符号变化，//这里应该有样条线var sign_change_on_the_right=(Pixel_in(像素，i-1，j+0)-阈值)*(Pixel_in(像素，i+0，j+0)-阈值)<；0；Var Sign_Change_On_the_Left=(Pixel_in(像素，i-1，j-1)-阈值)*(Pixel_in(像素，i+0，j-1)-阈值)<；0；var sign_change_on_the_Bottom=(Pixel_in(像素，i+0，j-1)-阈值)*(Pixel_in(像素，i+0，j+0)-阈值)<；0；Var sign_change_on_the_top=(Pixel_in(像素，i-1，j-1)-阈值)*(Pixel_in(像素，i-1，j+0)-阈值)<；0；if(sign_change_on_the_right||sign_change_on_the_Left){//拟合阈值等值线上的点var point=fit_point_Better(像素，阈值，[j，i])；var g=渐变(像素，点[0]，点[1])；//我们希望我们的切线对于水平段是X正的var Tangent=g[1]>；=0？[g[1]，-g[0]]：[-g[1]，g[0]]；//这是一个T或X交叉点，如果(Sign_Change_On_the_Left+Sign_Change_On_the_Right+Sign_Change_On_the_Bottom>；2)Tangent=[0，0.]；//如果(Sign_Change_On_the_Left&Amp；)存在一个(Sign_Change_On_the_Left&Amp；)切线=[0，0.]；//这是T或X交叉点，切线是不明确的。&；old_point){points.ush([old_point，point])；Tangents.ush([old_Tangent，Tangent])；}//如果(Sign_Change_On_The_Right){old_point=point；old_Tangent=Tangent；}//"；(var j=0；j<；=像素[0].length；j+=1){var old_point=[]；Var old_Tangent=[]；for(var i=0；i<；=picels.length；i+=1){var sign_change_on_the_right=(Pixel_in(像素，i-1，j+0)-阈值)*(Pixel_in(像素，i+0，j+0)-阈值)<；0；Var Sign_Change_On_the_Left=(Pixel_in(像素，i-1，j-1)-阈值)*(Pixel_in(像素，i+0，j-1)-阈值)<；0；var sign_change_on_the_Bottom=(Pixel_in(像素，i+0，j-1)-阈值)*(Pixel_in(像素，i+0，j+0)-阈值)<；0；Var sign_change_on_the_top=(Pixel_in(像素，i-1，j-1)-阈值)*(Pixel_in(像素，i-1，j+0)-阈值)<；0；if(sign_change_on_the_Bottom||sign_change_on_the_top){var point=fit_point_Better(像素，阈值，[j，i])；var g=渐变(像素，点[0]，点[1])；var切线=g[0]<；0？[g[1]，-g[0]]：[-g[1]，g[0]]；if(sign_change_on_the_Left+sign_change_on_the_right+sign_change_on_the_Bottom>；2)切线=[0，0.]；if(sign_change_on_the_top&；&；old_point){points.ush([old_point，point])；Tangents.ush([old_Tangent，Tangent])；}if(Sign_Change_On_The_Bottom){old_point=point；old_Tangent=Tangent；}return[点，切线]；}。

函数turn_points_and_tangents_into_splines(points_and_tangents){变量样条=[]；变量POINTS=POINTS_AND_TENGNTS[0]；VAR TENTINTS=POINTS_AND_TENTINTS[1]；FOR(var i=0；i<；points.length；++i){var px=SPLINE_FOR(Points[i][0][0]，Tangents[i][0][0]，Points[i][1][0]，Tangents[i][1][0])；Var Py=SPLINE_FOR(点[i][0][1]，切线[i][0][1]，点[i][1][1]，切线[i][1][1])；样条线.推([px，Py])；}返回样条曲线}。

此拆分对于算法不是必需的，但它使编辑图像和样条线表示中的模型成为可能。

现在，当我们有了算法后，让我们看看它在实践中是如何工作的。让从PGM导入灰度图像，将其转换为样条线，对其进行编辑，然后将其导出为SVG。

PGM是一种单通道ASCII图像格式。可以在GIMP或任何其他光栅图像编辑器中生成PGM文件。

P216 162550 0 0 0 77 125 38 0 0 0 00 120 255 254203 144 96 3 0 0 0 00 34 253 255 255 255 230 154 94 8 0 0 00 0 196 255 255 255 252 241 139 83 6 0 00 0 149 255 255 255 250 213 80 00 0 98 255 255 255 224 58 00 0 2 224 255 255 255 242 152 4。0 00 0 0 145 255 255 255 154 1 0 00 0 0 0 82 251 255 255 255 253 156 1 0 00 0 0 6 237 255 255 255 3 00 0 0 149 255 243 149 252 255 255 240 21 00 0 0 69 249 255 152 1 150 252 255 238 71 0 00 0 0 0 211 224 4 0 1 137 240 86 0 0 00 0 0 0 73 57 0 0 2 20 0 0 00 0 0 0

导入图像时，我们可以逐个像素编辑源图像，也可以移动样条点和切线。单击画布以增加像素的亮度。单击按住Shift键可减小该值。请注意，在本例中，图像编辑覆盖矢量。

当您对样条线感到满意时，可以将其导出为SVG。在本例中，仅支持大纲。没有填充物，没有着色。

你不必输出多项式。SVG支持Bézier曲线，与三次多项式基本相同。只是你写下的不是系数，而是控制点。

第一个点是样条曲线的起点。第二个是第一个点与切向量的三分之一之和。第三个是样条曲线的终点和第二条切线的三分之一的减去。第四个是样条曲线的终点。

导出函数的代码，就像这里提到的所有代码(包括视觉效果)一样，可以在Github上找到。

该算法展示了双线性插值、多项式近似、微分分析和迭代算法如何协同工作来解决实际问题。

我希望这个页面不仅能满足人们的好奇心，还能帮助人们在学习这些东西的同时保持灵感。根据我的经验，我知道基础微积分虽然不比交通规则复杂，但特别难学，因为你不会马上看到应用程序。你学习级数、极限、导数、积分，原因是什么？如何将这些知识转化为有用的东西呢？

https://wordsandbuttons.online/simple_image_vectorization.html