电脑视觉和刺绣

2021-04-08 22:09:02

在周末，我写了一个试图确定刺绣箍图像中使用的DMC线程的程序。我没有在大学拍摄电脑视觉课程 - 我之前也没有使用过OpenCV - 所以要学习一些事情很有趣，我希望你能从我的学习中学到。

当我的妻子想了解一些在r /刺绣的篮子里使用了哪些颜色时，这一切都开始了。因此，我开始了过度设计的解决方案：猜测的Python CLI，然后覆盖给定图像上的DMC线程调色板。

要开始，我审查了100个篮球最近发布到R /刺绣，并看到它们直接拍摄了中心靠近中心的箍。具有相当均匀的结构，我认为一点电脑视觉脚本可以帮助我。篮球是近乎完美的圈子使它们成为OpenCV的Hough圈变换的伟大目标。然而，照片非常嘈杂。很多东西出现在圈子中，由于高分辨率，该功能花了很长时间。

因此，为了更好地瞄准箍区域，我使用了一系列破坏性滤波器 - 将图像缩小，转换为灰色，然后应用以下内容：高斯本金，中美洲，适应性的，侵蚀，扩张。正如我们所看到的，这使得箍与Houghcircles更可识别。

在我拥有的100 r /绣花帖子上运行程序后，调整这些过滤器的值。我构建的程序的完整源代码可以在HEALEYCODES / HARVIZE-VISION中找到。

def apply_destructive_filters（图像）：＆＃34;＆＃34;＆＃34;应用一系列破坏性滤波器，目的是对Houghcircles功能更加明显的圆圈。＆＃34;＆＃34;＆＃34; kernel = np .ones（（5,5），np .uint8）filtered_image = cv2 .cvtcolor（图像，cv2 .color_bgr2gray）filtered_image = cv2 .gaussianblur（filtered_image，（5,5），0）filtered_image = cv2 .medianblur（ filtered_image，5）filtered_image = cv2 .adaptivethreshold（filtered_image，255，cv2 .adaptive_thresh_gaussian_c，cv2 .thresh_binary，11,3.5）filtered_image = cv2 .erode（filtered_image，内核，iterations = 1）filtered_image = cv2 .dilate（filtered_image，ernel，迭代= 1）返回filtered_image

可以找到多个圆圈是常见的。当发生这种情况时，我挑选最大，最中心的。这可以在上一个图像中看到。有效的圆圈是绿色的。我有时发现部分圆圈匹配箍标准（大和中央）。然而，这些是背景形状。用户很少发布在箍的图像中放大，因此我丢弃了超越边缘的圆圈。

有效圆圈通常包括箍边框的一部分。我不想将边界的颜色视为一个螺纹，所以我缩小了箍区域1％以隐藏它。

有454个DMC螺纹颜色。他们被称为米色灰色ult dk这样的东西。目标是采取拍摄线程的RBG颜色并找到最接近的匹配DMC颜色。我不考虑照明条件（您将如何做到这一点？）降低结果的准确性。我的程序找到了一些线程并猜测其他线程。对于最近的颜色查找，我使用了来自Scipy.spatial.kdtree的K-D树。

def rgb_to_dmc（r，g，b）：tree = sp .kdtree（rgb_colors）_，结果=树.query（（r，g，b））＃返回`rgb_colors`返回结果的索引

当我尝试在箍区域中的每个像素上打电话时，它构建的调色板太多了。当图像中有一种深红色线时，调色板将有六个或七种不同的DMC红色。我需要将组颜色更好地一起，因此我量化了图像。

＃https://stackoverflow.com/a/20715062 def量化_image（图像，div = 64）：＆＃34;＆＃34;＆＃34;减少图像中使用的不同颜色的数量。＆＃34;＆＃34;＆＃34;量化=图像// div * div + div // 2返回量化

压缩颜色空间，如此意味着，而不是找到多个深红色，我们只找到一个（希望正确的黑色）。这是应用上述功能之前和之后的图像。

为高分辨率图像中的每个像素调用K-D树查找很慢。对于我在此帖子中使用的示例图像，有600k像素（这意味着相同的查找数量），但只有30种不同的颜色。添加缓存是一个禁智的人。 Python建于最近使用的（LRU）缓存的建立得很好，现在我们的600K呼叫在不断的时间内执行。

使用DMC识别号码，我将调色板绘制在图像上。调色板也被发送到标准输出（例如，例如，＃647 Beaver Gray Med 15.81％）

由于在线文档和博客帖子的数量，我发现使用OpenCV的API非常直接。每当我有一个问题时，一个搜索给我带来了一个模糊相关的答案。也许我低估了图书馆的普及。最困难的部分（一如既往地）是询问的正确问题。

＃覆盖图像顶部的调色板，w，_ = reation_image .shapesize = int（w / len（filtered））y = idx的大小，枚举中的颜色（过滤）：b，g，r =（dmc_colors [颜色[0]] [＆＃34;蓝色＆＃34;]，dmc_colors [color [0]] [＆＃34;绿色＆＃34;]，dmc_colors [color [0]] [＆＃34;红色＆＃34; ]，）cv2 .rectangle（original_image，（size * idx，0），（（size * idx）+大小，大小），（b，g，r）， - 1）cv2 .puttext（original_image，dmc_colors [color [color [ 0] [＆＃34;牙线＆＃34;]，（size * idx，size-7），cv2 .font_hershey_simplex，0.5，（255 - b，255 - g，255 - r），1，）

我试着在Github上公开做大部分工作。这有助于人们（更多的人比我预期的更多人提供帮助），但我最感兴趣的是它对扩大我的志同道合的制造商网络的影响。在任何工作中收到留言，问题或公关是一种喜悦。

当我制作一个存储库公共时，我的目标是拥有一个可易化的自述文件和一些测试。对于此项目，DMC颜色查找是由测试的单元，示例图像用于端到端测试。我添加了一个GitHub动作，以便让人们检查他们的PRS是通过的（当我在手机上编辑源文件时，我也很高兴收到一封电子邮件！）。这个项目不太可能看到合作，因为它是我的学习项目，而不是一般工具。这是我的洁具。另外，它并没有真正的工作。

最近，我一直在使用Mypy为我的开源Python代码。它一直捕获错误并强制执行更好的代码模式。但可悲的是，我无法让OpenCV类型的存根工作，所以我删除了mypy。从我通常的github行动。

最后，我将使用像麻省理工学院那样的开源许可证完成。我讨厌某人从我的玩具项目中学习一些东西，但不能使用它。我总是试着介绍我的工作，就好像有它的最终用户一样 - 一个过程让我的代码更容易，而不是我没有。

评论或问题？我喜欢通过电子邮件与读者交谈。我写了关于代码。将我的帖子，项目和个人更新直接到您的收件箱！

https://healeycodes.com/computer-vision-and-embroidery/

戴尔阿莱恩软件自2007年以来推出了首款AMD动力的游戏笔记本电脑

2021-4-8 3:42

霍尼韦尔释放了其离子陷阱量子电脑的细节

2021-4-8 0:47

Microsoft Surface Leak：看起来表面笔记本电脑4即将推出

2021-4-8 0:47

信号测试付款功能让用户发送加密电脑

2021-4-7 3:16

tags users