将 Tensorflow Lite 输出转换为图像 C++

Convert Tensorflow Lite output into an image C++

提问人:vinc2905 提问时间:11/13/2023 最后编辑:vinc2905 更新时间:11/16/2023 访问量:40

问:

我在 Tensorflow 的帮助下在 Python 中创建了一个用于图像分割的模型,它为我提供了一个掩码作为输出。

在 Python 中,我可以简单地在两行上加载模型并生成输出(作为输入,我使用大小为 128x128 的灰度图像,这些图像以批处理的形式传递:[1,128,128,1])。

model.load_weights(path/to/model)
test_preds = model.predict(X_test)

模型输出图像

下一步是进行二值化,这给了我一个仅由值 255 或 0 组成的掩码。

preds_test_thresh = (test_preds >= 0.5).astype(np.uint8)
test_img = preds_test_thresh[1, :, :, 0]

阈值化后的输出图像

我现在的目标是在 C++ 中使用这个模型。为此,我首先将我的模型转换为TF-Lite模型,现在想将其加载到C++中并生成输出。

我对此的看法如下:

// Create model from file
    auto model = tflite::FlatBufferModel::BuildFromFile("path/to/model");
    if (model == nullptr)
        wxLogMessage("Model not loaded");
    else
        wxLogMessage("Model loaded");

    // Create an Interpreter with an InterpreterBuilder.
    std::unique_ptr<Interpreter> interpreter;
    tflite::ops::builtin::BuiltinOpResolver resolver;
    tflite::InterpreterBuilder(*model, resolver)(&interpreter);
    if (!interpreter)
        wxLogMessage("Interpreter not loaded");
    

    if (interpreter->AllocateTensors() != kTfLiteOk)
        wxLogMessage("Allocation failed");
    else
        wxLogMessage("Allocation success");

    // load image; get blue channel; resize to 128x128
    std::string image_path = samples::findFile("path/to/image");
    cv::Mat img = cv::imread(image_path);

    wxLogMessage(wxString::Format("%d x %d x %d", img.size[1], img.size[0], img.channels()));

    Mat bgr[3];
    split(img, bgr);

    Mat channelImg = bgr[0];

    Mat inputImg;

    channelImg.convertTo(inputImg, CV_32FC1, 1.0 / 255.0);

    cv::resize(inputImg, inputImg, cv::Size(128, 128));

    wxLogMessage(wxString::Format("%d x %d x %d", inputImg.size[1], inputImg.size[0], inputImg.channels()));

    // Fill input buffer
    float* input = interpreter->typed_input_tensor<float>(0);
    memcpy(input, inputImg.data, 128 * 128 * sizeof(float));

    // invoke interpreter
    if (interpreter->Invoke() != kTfLiteOk) {
        wxLogMessage("Failed to invoke");
    }

    // get output
    float* output = interpreter->typed_output_tensor<float>(0);

我从各种示例中获取了 C++ 代码的想法,并获得了浮点值。 但是,我没有得到图像作为输出,这就是为什么我已经尝试了一些生成 Mat 对象的方法,但不幸的是我没有得到正确的输出图像。

所以我现在的问题是,如何从模型的输出(如上所述的 Python 中)生成图像,以便继续工作?或者我是否必须更改上面的 C++ 代码中的某些内容才能获得输出?

C++ OpenCV 掩码 图像分割 TensorFlow-Lite

评论


答:

1赞 vinc2905 11/15/2023 #1

我自己解决了这个问题,代码如下:

// File path to the TensorFlow Lite model (.tflite)
const char* model_path = "pat";

// Load the TensorFlow Lite model
auto model = tflite::FlatBufferModel::BuildFromFile(model_path);
std::unique_ptr<tflite::Interpreter> interpreter;
tflite::ops::builtin::BuiltinOpResolver resolver;
tflite::InterpreterBuilder builder(*model, resolver);
builder(&interpreter);

// Check whether the interpreter has been successfully created
if (!interpreter)
    wxLogMessage("Interpreter not loaded");

// Assign TensorFlow Lite model
interpreter->AllocateTensors();

// Resize image to fit the model input [128x128x1]
const int image_width = 128;
const int image_height = 128;

cv::Mat input_image = cv::imread("path/to/image");

Mat bgr[3];
split(input_image, bgr);
input_image = bgr[0];

if (input_image.empty())
{
    wxLogMessage(wxString::Format("Could not read the image: %s", "path/to/image"));
}

cv::resize(input_image, input_image, cv::Size(image_width, image_height));

imshow("Display window", input_image);
waitKey(0);

// Pointer to the input tensor of the interpreter
float* input_tensor_data = interpreter->typed_input_tensor<float>(0);

// Copy the image pixels into the input tensor
for (int y = 0; y < image_height; ++y) {
    for (int x = 0; x < image_width; ++x) {
        input_tensor_data[y * image_width + x] = static_cast<float>(input_image.at<uchar>(y, x));
    }
}

// Run the model
interpreter->Invoke();

int output_tensor_count = interpreter->outputs().size();
for (int i = 0; i < output_tensor_count; ++i) {
    int output_tensor_index = interpreter->outputs()[i];
    TfLiteIntArray* output_dims = interpreter->tensor(output_tensor_index)->dims;
}

int output_tensor_index = 0;
TfLiteTensor* output_tensor = interpreter->tensor(output_tensor_index);

// output image with size of [128x128x1]
const int output_image_width = 128;
const int output_image_height = 128;

// Pointer to the output sensor data
float* output_data = interpreter->typed_output_tensor<float>(output_tensor_index);

cv::Mat output_image(output_image_height, output_image_width, CV_8UC1);

for (int y = 0; y < output_image_height; ++y) {
    for (int x = 0; x < output_image_width; ++x) {
        output_image.at<uchar>(y, x) = static_cast<uchar>(output_data[y * output_image_width + x] * 255.0);
    }
}

imshow("Display window", output_image);
waitKey(0);

两个主要问题是一方面填充输入张量,另一方面正确读取输出张量并填充它。

填充输入张量:

// Copy the image pixels into the input tensor
for (int y = 0; y < image_height; ++y) {
    for (int x = 0; x < image_width; ++x) {
        input_tensor_data[y * image_width + x] = static_cast<float>(input_image.at<uchar>(y, x));
    }
}

定义输出张量并按像素填充:

cv::Mat output_image(output_image_height, output_image_width, CV_8UC1);

for (int y = 0; y < output_image_height; ++y) {
    for (int x = 0; x < output_image_width; ++x) {
        output_image.at<uchar>(y, x) = static_cast<uchar>(output_data[y * output_image_width + x] * 255.0);
    }
}

我的错误最初是在读出输出张量时。我的灰度输入图像在 [0,255] 范围内,而我的模型输出的浮点向量在 [0,1] 范围内。因此,在填充输出图像时必须计算像素 *255,我没有考虑到这一点。

评论

0赞 vinc2905 11/16/2023
@zerocukor287我希望现在的解释更好。