使用简单方法在图像中检测血细胞

2022.10.29

    对象检测问题的基础是数据的外观。现在，本文将介绍可用于解决对象检测问题的不同深度学习架构。让我们首先讨论我们将要处理的问题陈述。
    目录
    1. 了解问题陈述：血细胞检测
    2. 数据集链接
    3. 解决对象检测问题的简单方法
    4. 实施简单方法的步骤
    · 加载数据集
    · 数据探索
    · 为简单方法准备数据集
    · 创建训练和验证集
    · 定义分类模型架构
    · 训练模型
    · 作出预测
    5. 结论
    了解问题陈述血细胞检测
    问题陈述
    对于一组给定的血细胞图像，我们必须检测图像中的白细胞。现在，这是来自数据集的示例图像。如你所见，你可以看到有一些红色阴影区域和蓝色或紫色区域。

    在上图中，红色阴影区域是红细胞（RBC），紫色阴影区域是白细胞（WBC），还有一些小的黑色突出部分是血小板。
    正如你在此图像中看到的那样，我们有多个对象和多个类。
    为简单起见，我们将其转换为单类单对象问题。这意味着我们将只考虑白细胞。
    因此，只有一个类，即白细胞，而忽略其余的类。此外，我们将只保留具有单个白细胞的图像。
    因此，具有多个白细胞的图像将从该数据集中删除。
    以下是我们将从该数据集中选择图像的方法。

    因此，我们删除了图像 2 和图像 5，因为图像 5 没有白细胞，而图像 2 有 2 个白细胞，其他图像保留在数据集中。同样，测试集也将只有一个白细胞。
    现在，对于每个图像，我们在白细胞周围都有一个边界框。正如你在这张图片中看到的，我们的文件名为 1．jpg，这些是白细胞周围边界框的边界框坐标。

    在下一节中，我们将介绍解决此对象检测问题的简单方法。
    解决对象检测问题的简单方法
    在本节中，我们将讨论一种解决对象检测问题的简单方法。所以让我们首先了解任务，我们必须在血细胞图像中检测白细胞，可以看到下图。

现在，最简单的方法是将图像划分为多个块，因此对于此图像，将图像划分为四个块。

我们对这些块中的每一个进行分类，因此第一个块没有白细胞，第二个块有一个白细胞，同样第三个和第四个没有任何白细胞。

    我们已经熟悉分类过程以及如何构建分类算法。因此，我们可以轻松地将这些单独的块中的每一个分类为 yes 和 no，以表示白细胞。
    现在，在下图中，具有白细胞的块（绿色框）可以表示为边界框，因此在这种情况下，我们将取这个块的坐标值，并将其返回为白细胞的边界框。

    现在为了实施这种方法，我们首先需要准备我们的训练数据。
    现在可能有一个问题，为什么我们需要准备训练数据？我们已经有了这些图像和边界框。
    我们的训练数据采用以下格式，其中我们有白细胞边界框和边界框坐标。

    现在，请注意我们有完整图像的这些边界框坐标，但我们将把这个图像分成四个块。我们需要所有这四个块的边界框坐标。下一个问题是我们如何做到这一点？
    我们必须定义一个新的训练数据，我们有文件名，如下图所示。
    我们有不同的块，对于每个块，我们有 Xmin、Xmax、Ymin 和 Ymax 值，它们表示这些块的坐标，最后，我们的目标变量是白细胞。图像中是否存在白细胞？

    现在在这种情况下，它将成为一个简单的分类问题。因此，对于每个图像，我们将其划分为四个不同的块，并为每个块创建边界框坐标。
    现在下一个问题是我们如何创建这些边界框坐标？这真的很简单。

    考虑到我们有一个大小为（640＊480）的图像。所以原点是（0，0）。上图有 x 轴和 y 轴，这里我们的坐标值为（640， 480）。
    现在，我们找出中点，它是（320，240）。一旦我们有了这些值，我们就可以很容易地找出每个块的坐标。所以对于第一个块，我们的 Xmin 和 Ymin 将是（0，0），而 Xmax， Ymax 将是（320，240）。

同样，我们可以在第二个、第三个和第四个块中找到它。一旦我们有了这些块中的每一个的坐标值或边界框值。下一个任务是确定此块中是否存在白细胞。

    在这里我们可以清楚地看到块 2 有白细胞，而其他块没有，但是我们不能在数据集中的每个块上对每个图像都手动标注白细胞。
    现在在下一节中，我们将实现简单的方法。
    实施简单方法的步骤
    在上一节中，我们讨论了用于对象检测的简单方法。现在让我们定义在血细胞检测问题上实施这种方法的步骤。
    这些是将要遵循的步骤：
    1. 加载数据集
    2. 数据探索
    3. 为简单方法准备数据集
    4. 创建训练和验证集
    5. 定义分类模型架构
    6. 训练模型
    7. 作出预测
    让我们进入下一节，实现上述步骤。
    1．加载所需的库和数据集
    因此，让我们首先从加载所需的库开始。numpy和pandas，matplotlib用来可视化数据，我们已经加载了一些库来处理图像并调整图像大小，最后是torch库。
    ＃ Importing Required Libraries
    import numpy as np
    import pandas as pd
    import matplotlib．pyplot as plt
    ％matplotlib inline
    import os
    from PIL import Image
    from skimage．transform import resize
    import torch
    from torch import nn
    现在我们将修复一个随机种子值。
    ＃ Fixing a random seed values to stop potential randomness
    seed ＝ 42
    rng ＝ np．random．RandomState（seed）
    在这里，我们将安装驱动器，因为数据集存储在驱动器上。
    ＃ mount the drive
    from google．colab import drive
    drive．mount（＇／content／drive＇）
    现在因为驱动器上的数据以 zip 格式提供。我们必须解压缩这些数据，在这里我们将解压缩数据。
    所以我们可以看到所有的图像都被加载并存储在一个名为 images 的文件夹中。在这个文件夹的末尾，我们有一个 CSV 文件，它是trained．csv。
    ＃ unzip the dataset from drive
    ！unzip ／content／drive／My Drive／train＿zedkk38．zip

    2．数据探索
    阅读 CSV 文件并找出存储在这个“train．csv”文件中的信息是什么。
    ＃＃ Reading target file
    data ＝ pd．read＿csv（＇train．csv＇）
    data．shape
    打印 CSV 文件的前几行，我们可以看到该文件具有 image＿names 以及 cell＿type，它将表示红细胞或白细胞等等。最后是此特定图像中此特定对象的边界框坐标。data．head（）

    因此，如果我们检查红细胞、白细胞和血小板的计数值。我们将看到红细胞具有最大计数值，其次是白细胞和血小板。
    data．cell＿type．value＿counts（）

    现在为简单起见，我们将只考虑白细胞。因此，我们选择了只有白细胞的数据。
    现在我们针对这些图像有 image＿names和 cell＿type WBC。还有边界框坐标。
    （data．loc［data［＇cell＿type＇］＝＝＇WBC＇］）．head（）

    让我们看看原始数据集中的几张图像以及这些图像的形状。
    我们可以看到这些图像的形状是（480，640，3）。这是一个具有三个通道的 RGB 图像，这是数据集中的第一张图像。
    image ＝ plt．imread（＇images／＇＋＇1．jpg＇）
    print（image．shape）
    plt．imshow（image）

下一步是用这个图像创建块。我们要学习如何把这张图片分成四个块。现在我们知道图像的形状是（640， 480）。因此这张图片的中间点是（320，240），中心是（0， 0）。

    因此，我们有图像中所有这些块的坐标，在这里我们将利用这些坐标并创建块。
    这些坐标的格式将是 Ymin、Ymax、Xmin 和 Xmax。这里我们的（Ymin， Ymax）是（0， 240）并且（Xmin， Xmax）是（0，320）。这基本上表示第一个块。
    同样，对于随后的第二个第三个和第四个块，我们有 image＿2、image＿3、image＿4。这是一个我们可以从图像创建块的过程。
    ＃ creating 4 patches from the image
    ＃ format ymin， ymax， xmin， xmax
    image＿1 ＝ image［0：240， 0：320，：］
    image＿2 ＝ image［0：240， 320：640，：］
    image＿3 ＝ image［240：480， 0：320，：］
    image＿4 ＝ image［240：480， 320：640，：］

现在我们需要为这些块分配一个目标值。为了做到这一点，我们计算并集的交集，我们必须找出交集区域和并集区域。

    所以交集区域就是这个特定的矩形，要找出面积，我们需要找出这个矩形的 Xmin、Xmax 和 Ymin、Ymax 坐标。
    def iou（box1， box2）：
      Irect＿xmin， Irect＿ymin ＝ max（box1［0］，box2［0］）， max（box1［2］，box2［2］）
      Irect＿xmax， Irect＿ymax ＝ min（box1［1］，box2［1］）， min（box1［3］，box2［3］）
      if Irect＿xmax ＜ Irect＿xmin or Irect＿ymax ＜ Irect＿ymin：
      target ＝ inter＿area ＝ 0
      else：
      inter＿area ＝ np．abs（（Irect＿xmax － Irect＿xmin）＊（Irect＿ymax － Irect＿ymin））
      box1＿area ＝（box1［1］－box1［0］）＊（box1［3］－box1［2］）
      box2＿area ＝（box2［1］－box2［0］）＊（box2［3］－box2［2］）
      union＿area ＝ box1＿area＋box2＿area－inter＿area
      iou ＝ inter＿area／union＿area
      target ＝ int（iou ＞ 0．1）
      return target
    我们有来自训练 CSV 文件的原始边界框坐标。当我将这两个值用作我们定义的“ iou”函数的输入时，目标为 1。
    你也可以尝试使用不同的块，也可以基于你将得到的目标值。
    box1＝［320， 640， 0， 240］
    box2＝［93， 296， 1， 173］
    iou（box1， box2）
    输出为 0。现在下一步是准备数据集。
    3．为简单方法准备数据集
    我们只考虑并探索了数据集中的单个图像。因此，让我们对数据集中的所有图像执行这些步骤。这里是我们拥有的完整数据。
    data．head（）

    现在，我们正在转换这些细胞类型，红细胞为0，白细胞为 1，血小板为 2。
    data［＇cell＿type＇］＝ data［＇cell＿type＇］．replace（｛＇RBC＇： 0，＇WBC＇： 1，＇Platelets＇： 2｝）
    现在我们必须选择只有一个白细胞的图像。

    因此，首先我们创建数据集的副本，然后仅保留白细胞并删除任何具有多个白细胞的图像。
    ＃＃ keep only Single WBCs
    data＿wbc ＝ data．loc［data．cell＿type ＝＝ 1］．copy（）
    data＿wbc ＝ data＿wbc．drop＿duplicates（subset＝［＇image＿names＇，＇cell＿type＇］， keep＝False）
    现在我们已经选择了图像。我们将根据输入图像大小设置块坐标。
    我们正在逐一读取图像并存储该特定图像的白细胞边界框坐标，使用我们在此处定义的块坐标从该图像中提取块。
    然后我们使用自定义的 IoU 函数找出每个块的目标值。最后，在这里我们将块大小调整为标准大小（224， 224， 3）。在这里，我们正在为每个块创建最终输入数据和目标数据。
    ＃ create empty lists
    X ＝［］
    Y ＝［］
    ＃ set patch co－ordinates
    patch＿1＿coordinates ＝［0， 320， 0， 240］
    patch＿2＿coordinates ＝［320， 640， 0， 240］
    patch＿3＿coordinates ＝［0， 320， 240， 480］
    patch＿4＿coordinates ＝［320， 640， 240， 480］
    for idx， row in data＿wbc．iterrows（）：
      ＃ read image
      image ＝ plt．imread（＇images／＇＋ row．image＿names）
      bb＿coordinates ＝［row．xmin， row．xmax， row．ymin， row．ymax］
      ＃ extract patches
      patch＿1 ＝ image［patch＿1＿coordinates［2］：patch＿1＿coordinates［3］，
     patch＿1＿coordinates［0］：patch＿1＿coordinates［1］，：］
      patch＿2 ＝ image［patch＿2＿coordinates［2］：patch＿2＿coordinates［3］，
     patch＿2＿coordinates［0］：patch＿2＿coordinates［1］，：］
      patch＿3 ＝ image［patch＿3＿coordinates［2］：patch＿3＿coordinates［3］，
     patch＿3＿coordinates［0］：patch＿3＿coordinates［1］，：］
      patch＿4 ＝ image［patch＿4＿coordinates［2］：patch＿4＿coordinates［3］，
     patch＿4＿coordinates［0］：patch＿4＿coordinates［1］，：］
      ＃ set default values
      target＿1 ＝ target＿2 ＝ target＿3 ＝ target＿4 ＝ inter＿area ＝ 0
      ＃ figure out if the patch contains the object
      ＃＃ for patch＿1
      target＿1 ＝ iou（patch＿1＿coordinates， bb＿coordinates ）
      ＃＃ for patch＿2
      target＿2 ＝ iou（patch＿2＿coordinates， bb＿coordinates）
      ＃＃ for patch＿3
      target＿3 ＝ iou（patch＿3＿coordinates， bb＿coordinates）
      ＃＃ for patch＿4
      target＿4 ＝ iou（patch＿4＿coordinates， bb＿coordinates）
      ＃ resize the patches
      patch＿1 ＝ resize（patch＿1，（224， 224， 3）， preserve＿range＝True）
      patch＿2 ＝ resize（patch＿2，（224， 224， 3）， preserve＿range＝True）
      patch＿3 ＝ resize（patch＿3，（224， 224， 3）， preserve＿range＝True）
      patch＿4 ＝ resize（patch＿4，（224， 224， 3）， preserve＿range＝True）
      ＃ create final input data
      X．extend（［patch＿1， patch＿2， patch＿3， patch＿4］）
      ＃ create target data
      Y．extend（［target＿1， target＿2， target＿3， target＿4］）
    ＃ convert these lists to single numpy array
    X ＝ np．array（X）
    Y ＝ np．array（Y）
    现在，让我们打印原始数据和刚刚创建的新数据的形状。我们可以看到我们最初有 240 张图像。
    现在我们将这些图像分成四部分，即（960，224，224，3）。这是图像的形状。
    ＃ 4 patches for every image
    data＿wbc．shape， X．shape， Y．shape
    让我们快速看一下我们刚刚创建的这些图像之一。这是我们的原始图像，这是原始图像的最后一个块或第四个块。我们可以看到分配的目标是1。
    image ＝ plt．imread（＇images／＇＋＇1．jpg＇）
    】
    plt．imshow（image）

    如果我们检查任何其他块，假设我要检查此图像的第一个块，这里会将目标设为0。你将获得第一个块。
    同样，你可以确保将所有图像转换为块并相应地分配目标。
    plt．imshow（X［0］．astype（＇uint8＇））， Y［0］

    4．准备训练和验证集
    现在我们有了数据集。我们将准备我们的训练和验证集。现在请注意，这里我们的图像形状为（224，224，3）。
    ＃ 4 patches for every image
    data＿wbc．shape， X．shape， Y．shape
    输出是：
    （（240， 6），（960， 224， 224， 3），（960，））
    在 PyTorch 中，我们首先需要拥有通道。因此，我们将移动具有形状（3，224，224）的轴。
    X ＝ np．moveaxis（X，－1， 1）
    X．shape
    输出是：
    （960， 3， 224， 224）
    现在，我们对图像像素值进行归一化。
    X ＝ X ／ X．max（）
    使用训练测试拆分功能，我们将创建一个训练集和验证集。
    from sklearn．model＿selection import train＿test＿split
    X＿train， X＿valid， Y＿train， Y＿valid＝train＿test＿split（X， Y， test＿size＝0．1，
     random＿state＝seed）
    X＿train．shape， X＿valid．shape， Y＿train．shape， Y＿valid．shape
    上述代码的输出是：
    （（864， 3， 224， 224），（96， 3， 224， 224），（864，），（96，））
    现在，我们要将训练集和验证集都转换为张量，因为它们是“ numpy”数组。
    X＿train ＝ torch．FloatTensor（X＿train）
    Y＿train ＝ torch．FloatTensor（Y＿train）
    X＿valid ＝ torch．FloatTensor（X＿valid）
    Y＿valid ＝ torch．FloatTensor（Y＿valid）
    5．模型构建
    现在，我们要构建我们的模型，在这里我们安装了一个库，它是 PyTorch 模型摘要。
    ！pip install pytorch－model－summary

    这仅用于在 PyTorch 中打印模型摘要。现在我们从这里导入汇总函数。
    from pytorch＿model＿summary import summary
    这是我们为方法定义的架构。
    我们定义了一个顺序模型，其中有Conv2d 层，输入通道数为 3，过滤器数量为 64，过滤器的大小为 5，步幅设置为 2。对于这个 Conv2d 层有 ReLU 激活函数。一个池化层，窗口大小为 4，步幅为 2，然后是卷积层。
    现在展平 Conv2d 层的输出，最后是全连接层和 sigmoid 激活函数。
    ＃＃ model architecture
    model ＝ nn．Sequential（
      nn．Conv2d（in＿channels＝3， out＿channels＝64， kernel＿size＝5， stride＝2），
      nn．ReLU（），
      nn．MaxPool2d（kernel＿size＝4，stride＝2），
      nn．Conv2d（in＿channels＝64， out＿channels＝64， kernel＿size＝5， stride＝2），
      nn．Flatten（），
      nn．Linear（40000， 1），
      nn．Sigmoid（）
    ）
    在这里打印模型，将是我们定义的模型架构。
    print（model）

    使用summary函数，我们可以查看模型摘要。因此，这将为我们返回每个层的输出形状，每个层的可训练参数的数量。现在我们的模型已经准备好了。
    print（summary（model， X＿train［：1］））

    现在模型已经准备好训练了。
    6．训练模型
    让我们训练这个模型。所以我们要定义我们的损失函数和优化函数。我们将二元交叉熵定义为损失和Adam优化器。然后我们将模型传输到 GPU。
    在这里，我们从输入图像中提取批次来训练这个模型。
    ＃＃ loss and optimizer
    criterion ＝ torch．nn．BCELoss（）
    optimizer ＝ torch．optim．Adam（model．parameters（）， lr＝0．001）
    ＃＃ GPU device
    if torch．cuda．is＿available（）：
     model ＝ model．cuda（）
     criterion ＝ criterion．cuda（）
    因此，我们从 x＿train 中提取了批次并使用了这些批次。我们将对该模型进行总共 15 个 epoch 的训练。我们还设置了一个 optimizer．Zero＿grad（）并将输出存储在这里。
    现在我们正在计算损失并存储所有损失并执行反向传播和更新参数。此外，我们在每个 epoch 之后打印损失。
    在输出中，我们可以看到每个时期的损失都在减少。所以这个模型的训练就完成了。
    ＃ batch size of the model
    batch＿size ＝ 32
    ＃ defining the training phase
    model．train（）
    for epoch in range（15）：
      ＃ setting initial loss as 0
      train＿loss ＝ 0．0
      ＃ to randomly pick the images without replacement in batches
      permutation ＝ torch．randperm（X＿train．size（）［0］）
      ＃ to keep track of training loss
      training＿loss ＝［］
      ＃ for loop for training on batches
      for i in range（0，X＿train．size（）［0］， batch＿size）：
      ＃ taking the indices from randomly generated values
      indices ＝ permutation［i：i＋batch＿size］
      ＃ getting the images and labels for a batch
      batch＿x， batch＿y ＝ X＿train［indices］， Y＿train［indices］
      if torch．cuda．is＿available（）：
      batch＿x， batch＿y ＝ batch＿x．cuda（）．float（）， batch＿y．cuda（）．float（）
      ＃ clearing all the accumulated gradients
      optimizer．zero＿grad（）
      ＃ mini batch computation
      outputs ＝ model（batch＿x）
      ＃ calculating the loss for a mini batch
      loss ＝ criterion（outputs．squeeze（），batch＿y）
      ＃ storing the loss for every mini batch
      training＿loss．append（loss．item（））
      ＃ calculating the gradients
      loss．backward（）
      ＃ updating the parameters
      optimizer．step（）
      training＿loss ＝ np．average（training＿loss）
      print（＇epoch： t＇， epoch，＇t training loss： t＇， training＿loss）

    7．做出预测
    现在让我们使用这个模型来进行预测。所以在这里我只从验证集中获取前五个输入并将它们传输到 Cuda。
    output ＝ model（X＿valid［：5］．to（＇cuda＇））．cpu（）．detach（）．numpy（）
    这是我们拍摄的前五张图像的输出。现在我们可以看到前两个的输出是没有白细胞或有白细胞。
    output
    这是输出：
    array（［［0．00641595］，
      ［0．01172841］，
      ［0．99919134］，
      ［0．01065345］，
      ［0．00520921］］， dtype＝float32）
    绘制图像。我们可以看到这是第三张图片，这里的模型说有一个白细胞，我们可以看到这张图片中有一个白细胞。
    plt．imshow（np．transpose（X＿valid［2］））

    同样，我们可以检查另一张图像，因此将获取第一张图像。
    你可以看到输出图像，这个图像是我们的输入块，这个块中没有白细胞。
    plt．imshow（np．transpose（X＿valid［1］））

    这是一种非常简单的方法，可以进行预测或识别具有白细胞的图像的块或部分。
    结论
    使用简单方法了解使用图像数据集进行血细胞检测的实际实现。这是解决业务问题和开发模型的真正挑战。
    在处理图像数据时，你必须分析一些任务，例如边界框、计算 IoU 值、评估指标。本文的下一个级别（未来任务）是一个图像可以有多个对象。任务是检测每个图像中的对象。希望这些文章能帮助你了解如何使用图像数据检测血细胞，如何建立检测模型，我们将使用这种技术，并将其应用于医学分析领域。